В Китае создана база данных FAIR1M из спутниковых изображений в высоком разрешении, которая заявлена как самая большая в мире. Она в десятки и даже сотни раз превышает предыдущие наборы данных для обучения ИИ. С помощью новой базы можно обучить ИИ определять объекты с точностью до идентификации моделей самолётов и назначения сооружений. База FAIR1M — это разработка для гражданских целей и будет открыта для всех желающих.
Источник изображения: Chinese Academy of Sciences
В базе FAIR1M около 80 % изображений в высоком разрешении получены с помощью китайских спутников дистанционного зондирования земли «Гаофэнь». Эти спутники Китай запускает с 2013 года, и сегодня они являются для Китая основными поставщиками высококачественных изображений Земли из космоса. Остальные 20 % изображений для базы FAIR1M были взяты из Google Earth. База насчитывает 15 тыс. изображений с одним миллионом объектов, помеченных как «сцена». До этого крупнейшей подобной базой была французская VEDAI с выделением 3600 сцен.
Распознавание сцены сложнее, чем идентификация объекта. В случае сцены необходимо оценить несколько объектов на изображении, связать их и определить контекст. Китайская база FAIR1M позволяет обучить ИИ на примере целого миллиона выделенных вручную сцен, что открывает перед разработчиками алгоритмов распознавания массу возможностей.
Если верить китайским источникам, база FAIR1M выбрана Международным обществом фотограмметрии и дистанционного зондирования в качестве эталона для обучения ИИ. Международному сообществу база FAIR1M будет открыта в июне этого года. Разработчики признаются, что FAIR1M слабее аналогичных по назначению военных баз, но быстро их догоняет и оперирует намного большим числом объектов, которые можно распознать.