Хибридният изкуствен интелект (наричан по-долу AI) и нов набор от данни и показатели за оценка на възможностите на AI алгоритмите в разсъжденията за действията, съдържащи се във видео информация, бяха представени от изследователи от IBM, MIT, Harvard и DeepMind на конференцията ICLR 2020, докладва TheNextweb на 17 май.
Новата база данни и изследователска среда, представена на ICLR 2020, се нарича CoLlision Events за видео представяне и разсъждение или CLEVRER. Те са базирани на CLEVR, визуален набор от въпроси и отговори, разработен в университета в Станфорд през 2017 г. CLEVR е набор от задачи, представляващи неподвижни изображения на твърди предмети. АИ агентът трябва да може да анализира сцената и да отговори на няколко въпроса за броя на обектите, техните атрибути и техните пространствени отношения.
Като решение на трудна задача за класическия ИИ, изследователите представиха модел на невро-символично динамично мислене, комбинация от невронни мрежи и символичен изкуствен интелект.
Резултатите показаха, че включването на невронни мрежи и символни програми в един AI модел може да комбинира силните им страни и да преодолее техните слабости. „Символичното представяне предоставя мощна обща рамка за визия, език, динамика и причинно-следствена връзка“, отбелязват авторите и добавят, че символичните програми позволяват на модела „изрично да улавя композиционността, залегнала в причинно-следствената структура на видеото и логиката на въпроса“.
Предимствата на такива системи са ограничени от безусловни недостатъци. Данните, използвани за обучението на модела, изискват допълнителни пояснения, които могат да бъдат прекалено модни и скъпи в реални приложения.