Розробники Штучного Інтелекту на варті «інтелекту»

Чому Nuance виступає за створення нового типу тесту Тюрінга? Останнім часом популярна думка, що було б непогано переосмислити тест Тюрінга, на відміну від його традиційного використання.


Nuance Communications — транснаціональна корпорація з виробництва програмного забезпечення, керована Burlington, Massachusetts, США. Розробляє програми, що працюють з голосовими даними і зображеннями. Серед технологій компанії: розпізнавання мови на серверах системи автоматизованої обробки дзвінків, програми та системи ведення медичних записів, оптичне розпізнавання символів.

Тест Тюрінга — тест на означення того, чи машинний інтелект можна ототожнити із людським. Відомий англійський учений Алан Тюрінг сформулював тезу, спрямовану на визначення моменту, з якого машину можна вважати інтелектуальною. Нехай експерт за допомогою телефону або подібного віддаленого пристрою спілкується з кимось (або чимось), що може бути як людиною, так і машиною.

Суть тесту полягає у тому, що експерт дає певні тести-завдання. За результатами відповідей він повинен визначити, з ким він має справу — з людиною чи з ЕОМ. Якщо він приймає комп’ютер за людину, комп’ютер може вважатися інтелектуальним. Така перевірка дістала назву тесту Тюрінга. Сьогодні тест вважається пройденим, якщо понад 30% осіб, що спілкувалися з комп’ютером, вважають його людиною.

На конкурсі, присвяченому 60-річчю з дня смерті Тюрінга, який проходив 7 червня 2014 року, комп’ютерна програма «Євген Густман», що видавала себе за 13-річного хлопчика з України, переконала 33% суддів, що вона людина, ставши першим в історії комп’ютером, який пройшов випробування. Але багато скептиків не вважають, що тест був пройдений.

Незважаючи на думки скептиків і сумніви з боку деяких учених, інтелектуальні програми — це комплекс нових морально-етичних проблем. Так, наприклад, вони можуть працювати на кібер-злочинців, або складати тести на отримання прав у ДАІ, а от у 2011 році суперкомп’ютер IBM на ім’я Ватсон виграв у інтелектуальній телевікторині 1 млн доларів. Відтоді вчені шукають альтернативні тести на визначення штучного інтелекту.

Так як перші ЕОМ у 50-х роках (періоду, коли був вигаданий тест Тюрінга) вважалися супермашинами, можливості яких перевищують можливості людини, то і тести для них вигадувалися зі складними обчисленнями або поняттями. Так, у 2000 році тест виглядав приблизно так:

Т(тестувальник): я називатиму слова, загадуватиму математичні дії, а ти називатимеш асоціації до понять або обчислюватимеш, гаразд?
К(комп’ютерна програма): гаразд
Т: собака
К: істота виду Canis Familiaris
Т: скільки буде, якщо помножити 56 на 33?
К: 1848
Т: ти такий швидкий!
К: це мої улюблені числа.
Одним з найпопулярніших сучасних тестів, розроблених Nuance є Winograd Schema Challenge (WSC), яка замінює аж занадто розумні бесіди з комп’ютерами на питання побутового змісту до інших комп’ютерів.

Вперше запропонований у дослідницькому Університеті Торонто в 2011 році Winograd Schema Challenge (WSC), включає в себе надання комп’ютеру повідомлення, що складається з використання речення з неозначеним займенником, далі постановки простого запитання про це. Простим прикладом може бути щось на зразок цього: «Кішка сиділа на ковдрі, тому що вона була тепла. Що було тепло?».
Це робиться для того, щоб наперед обхитрити розумні програми, які могли б використати обернений порядок слів або власний випадковий словниковий запас, щоб відповісти на питання. Це перевірка на те, чи машина “думає”, адже завжди є слово, яке можна замінити, щоб дати логічну з точки зору комп’ютера відповідь, у той же час, для людини речення звучить безглуздо. У наведеному вище прикладі, «нерозумний» бот протиставляє поняття «тепло-холодно», замінює ковдру на кота або ж просто перепитує.

Загалом схема має такий принцип:
1. Дві сторони, що згадуються в реченні, виражені іменниками (у нас це кішка і ковдра). Вони можуть бути жіночого, чоловічого або середнього роду, а також позначати групу людей або об’єктів.
2.Займенник або присвійний прикметник використовується стосовно одного з іменників, але також граматично підходить і до іншого. Для чоловічого роду — він, його, йому, для жіночого роду — вона, її, їй, для середнього роду — воно, його, йому, для множини — вони, їх, ім.
3. Задане питання полягає у визначенні референта, займенника або присвійного прикметника. Відповідь 0 — це завжди перша сторона, згадувана в реченні, (кішка) і відповідь 1 — це друга сторона (ковдра).
4. Існує слово (так зване спеціальне слово), яке з’являється в реченні і, можливо, питання. Коли воно замінюється іншим словом (альтернативним), речення зберігає сенс, але відповідь змінюється.

За словами Чарлі Ортіса, старшого провідного менеджера та старшого наукового співробітника, в Nuance Natural Language and Artificial Intelligence Laboratory, головною проблемою дискусій на основі підходів до тесту Тюрінга є те, що сучасні програми більше базуються на хитрощах, ніж на фактичному визначенні штучного інтелекту. Адже заплутати можна і людину, яка незнайома зі законами логіки, а от машина легко обійде ці тести.
Боти, на зразок зазначеного вище, видають себе за особистостей (в нашому випадку, підліток з іншої країни, що зміг обвести навколо пальця тільки одну третину людей-суддів), спричиняють похибки, у тому разі, якщо їхні людські аналоги погано володіють граматикою та не вміють правильно будувати речення. Вони допускають помилки навмисно і тоді спілкування здається більш людяним. Якщо їм поставили питання про себе або поставити пряме запитання, вони можуть змінити тему чи інакше ухилитися від відповіді. Хоча це може обдурити деяких людей, Ортіс пояснив, що Winograd Schema допомагає іншим комп’ютерам зловити ботів на брехні.
«Тест Тюрінга в певному сенсі є відкритим і дозволяє занадто багато, і важко перевірити, чи домоглися Ви прогресу ( у створенні штучного інтелекту — прим. автора)» , — сказав Ортіс. З іншого боку, звичайна розмова включає в себе багато знань, як загальних, наприклад, про навколишній світ, так і конкретних, наприклад, складні терміни чи визначення, і цей спосіб працює шляхом опору на здоровий глузд. Завдання Winograd Schema — дозволити дослідникам оцінити прогрес, який вони роблять на цьому фронті.

Ортіс висловив сумнів у відповідь на питання, чи довго ШІ не зможе обдурювати цей тест. Такий прорив може статися швидше, ніж скептики могли б думати. Окрім нової Winograd Schema by Nuance, є вже кілька спроб побудови системи штучного інтелекту, яка здатна до людського рівня мислення і навіть проходить короткі опитування на іспитах. Серед них — проект Todai з Японії, який працює над створенням робота, що може скласти вступні іспити у коледж, а дослідники Allen Institute for Artificial Intelligence в Сієтлі створюють систему, що може пройти тест четвертого класу. Ортіс називає такий прогрес рухом у бік «великого знання».
Нікого не здивує, що ідея Nuance спонсорувати конкурс серед розумних машин досить амбіційна, але вони сподіваються, що це стимулюватиме прогрес у галузі розробки штучного інтелекту. Компанія отримує прибуток від частини грошей, що йдуть від продажу віртуальних помічників, головним чином від продажу додатку Siri для продукції компанії Apple.
У майбутньому, за словами Ортіса, компанія сподівається, що її програмні технології будуть мати загальні і навіть конкретні знання у деяких галузях, та навіть будуть у змозі брати до уваги контекстну інформацію (наприклад, чи сидить користувач у своїй машині), перш ніж відповісти на його запитання. «Ви не отримаєте особистого помічника, який замінить Вам лікаря, або кухара, але Ви отримаєте особистого помічника, який допоможе вам приймати важливі рішення.»

 ГалинаТютюнник