Чат-боти зайшли в глухий кут: що стане новим етапом розвитку ШІ

Час ChatGPT та Claude поступово минає Провідні науковці у сфері ШІ заявляють про глухий кут у дослідженні класичних чат-ботів. Новим технологічним фронтиром стають так звані "моделі світу", здатні розуміти закони фізики та керувати роботами.

Чат-боти зайшли в глухий кут: що стане новим етапом розвитку ШІ
Час ChatGPT та Claude поступово минає

Провідні науковці у сфері ШІ заявляють про глухий кут у дослідженні класичних чат-ботів. Новим технологічним фронтиром стають так звані "моделі світу", здатні розуміти закони фізики та керувати роботами.

Про це інформує РБК-Україна з посиланням на Techxsplore.

За словами "хрещеної матері ШІ" Фей-Фей Лі, професорки комп'ютерних наук Стенфордського університету, сучасні мовні моделі здатні вивчити лише статистичну структуру тексту з книг, тоді як для ШІ критично важливо навчитися "читати оточення".

Чому книжкових знань замало для роботів?

Скепсис щодо подальшого розвитку генеративного ШІ висловлюють чимало мастодонтів індустрії. Зокрема, Ян Лекун торік залишив посаду головного наукового співробітника Meta з питань ШІ, щоб очолити нову паризьку лабораторію Advanced Machine Intelligence Labs, яка фокусується саме на моделях світу.

Головна мета таких систем - навчити ШІ прогнозувати наслідки власних дій у реальності.

"Жоден сучасний чат-бот не здатний самостійно взяти та підняти кавову чашку. Ця дія вимагає розуміння геометрії простору, динаміки руху руки та фізичного контакту з поверхнею, що є набагато складнішим за просте передбачення наступного пікселя чи слова", - пояснює декан факультету комп'ютерних наук Університету Карнегі-Меллон Мартіал Хебер.

Моделі світу мають стати основою для "фізичного" або "втіленого ШІ" (embodied AI), виконуючи роль аналога людської нервової системи та спинного мозку, які дозволяють тілу миттєво адаптуватися до змін навколишнього середовища.

Читайте більше: Людство може зникнути без сліду: що збереже архів Memory of Mankind

Комп'ютерний вчений Луїс Кастрікато, який покинув докторантуру в Браунівському університеті заради заснування стартапу Overworld, переконаний, що індустрія пройшла етап фундаментальних досліджень LLM і тепер рухається у бік інтерактивності.

Його компанія використовує моделі світу для створення тривимірних ігрових просторів, які адаптуються та трансформуються безпосередньо під час взаємодії віртуального персонажа з об'єктами.

Три категорії моделей світу

Попри те, що термін "модель світу" швидко перетворюється на черговий модний термін маркетологів, Фей-Фей Лі спробувала упорядкувати класифікацію цих технологій, розділивши їх на три ключові групи:

Візуалізатори (renderers) створюють бездоганну та реалістичну картинку віртуальних світів, але мають низьку точність симуляції фізики, тож несуть мало користі для навчання реальних роботів.

Симулятори (simulators): віртуальні тренувальні полігони, які з високою точністю відтворюють реальну фізичну структуру нашого світу.

Планувальники (planners): найбільш комерційно перспективні системи, здатні передбачати та планувати дії ШІ-агента або робота у неструктурованому та хаотичному реальному середовищі.

Більше цікавого: Google відкрив перший у світі музей ШІ-мистецтва: експонати змінюються наживо

Нова філософія архітектури ШІ вже залучає значні венчурні інвестиції. Фонди активно фінансують проєкти Causal Labs (моделі світу для прогнозування погоди) та Extropic (розробка спеціалізованих мікросхем для моделей світу).

Інвестори переконані, що майбутнє технологій належатиме не одній гігантській універсальній моделі, а великій кількості різноманітних систем, оптимізованих для взаємодії з фізичною реальністю.

Ще більше цікавого:

  • Перший процесор OpenAI: навіщо розробникам ChatGPT власний чип
  • Мільйон супутників для ШІ: SpaceX створює дата-центр на орбіті