Menu

Дослідники відучили лихословити суперкомп'ютер Watson, очистивши деякі ділянки його пам'яті

Исследователи отучили сквернословить суперкомпьютер Watson, очистив некоторые участки его памяти



Будь-якої з мов, на якому говорять люди, трохи змінюється з часом. У розмовної мови люди нерідко об'єднують різні слова, поділяють звичайні слова на два слова, скорочують їх тим чи іншим способом. З-за цього іноді в звичайній мові виникають досить незвичайні і курйозні обороти, які можуть застосовувати тільки люди певного складу і тільки у певних ситуаціях. Будь-яка людина, незалежно від його інтелектуальних здібностей, без особливої праці може відфільтрувати свою промову в залежності від навколишньої ситуації, але це є величезною проблемою для комп'ютерного штучного інтелекту, який запрограмований для спілкування природною мовою.

У 1999 році Аарон Пекхем (Aaron Peckham), який в той момент був студентом Каліфорнійського політехнічного університету, створив онлайн-сервіс Urban Dictionary. Цей сервіс є англомовним онлайн-словником в який заносяться сленгові слова і вирази, які супроводжуються словниковими визначеннями. На лютий місяць 2012 року в словнику Urban Dictionary вже містилося близько 6.4 мільйона слів і виразів, серед яких досить багато "міцних" нецензурних виразів.

У дослідників, що займаються розробкою і вдосконаленням системи штучного інтелекту суперкомп'ютера Watson компанії IBM, з'явилася чудова на їх погляд ідея "згодувати" вміст словника Urban Dictionary суперкомп'ютера. На думку дослідників, така формалізація неофіційного мови спілкування могла б стати хорошою допомогою Watson-в розумінні способу, яким спілкуються звичайні люди, І після недовгих роздумів команда дослідників дозволила суперкомп'ютера завантажити словник Urban Dictionary у його пам'ять, провести обробку та індексацію отриманих даних.

Тут же виникла проблема, пов'язана з тим, що неофіційний мова є "брудною" і грубою, повним прокльонів, образ, нових назв старих "брудних" термінів і т.п. Система штучного інтелекту Watson-а не змогла визначити відмінностей між ввічливим мовою та безліччю профанацій, якими повний словник Urban Dictionary. Крім цього суперкомп'ютер Watson встиг нахапатися слівець і з інших джерел, у тому числі і з Вікіпедії. В результаті мова, синтезуються суперкомп'ютером, перетворилася на потік лайок і образ, на деякі запитання дослідників суперкомп'ютер відповідав просто, коротко і дохідливо: "bullshit" -)).

Після цього дослідникам нічого не залишалося робити, крім як очистити пам'ять суперкомп'ютера Watson від даних словника Urban Dictionary. Крім цього, команда з 35 фахівців розробила програмний фільтр, який буде перешкоджати суперкомп'ютера лаятися і вживати нецензурні вирази в майбутньому, незалежно від джерела, через який вони до нього потрапили.

|