Игра на "Дипломация" с "Цицерон": Изкуственият интелект, който блъфира почти като човек Снимка: © webDiplomacy.net

Абонирайте се за нюзлетъра на "Булевард България", за да получавате селекция с най-интересните теми на седмицата през погледа на нашия екип:


Той може да преговаря, да бръфира, дори да лъже и много трудно ще разпознаете, че срещу вас не стои човек. На 22 ноември Meta представи новата разработка в сферата на изкуствения интелект (AI) - алгоритъмът "Цицерон".

Кръстен на името на римския държавник и философ, "Цицерон" побеждава безкомпромисно живи хора в онлайн версията на настолната игра "Дипломация" (Diplomacy). По време на тестовете на алгоритъма от август до октомври тази година той участва в 40 игри срещу 82-ма души. И никой от хората не разбира, че насреща им не е друг човек. IA постига средно два пъти повече точки от живите играчи и се настанява сред 10-те процета най-добри стратези в играта.

"Той е безмилостен в прилагането на стратегията си, но не достатъчно, за да дразни или разстройва другите" - това е мнението на световния шампион в играта Андрю Гоф.

Какво е "Дипломация"?

"Дипломация" е стратегическа настолна игра, измислена от американеца Алън Брайън Колхамър през 1954 г. Тя е нещо като компилация от популярната игра "Риск", традиционния покер и шоуто "Сървайвър", описват я от "Мета".

Игралното поле е карта на Европа от 1901 г., а участниците - най-много седем - влизат в ролята на лидери на великите сили по това време: Австро-Унгария, Великобритания, Германия, Италия, Русия, Турция и Франция. Ако играчите са по-малко, всеки от тях управлява по няколко държави едновременно. Победител е този, под чийто контрол се намират половината от т.нар. центрове за поддръжка - специални зони на полето, които позволяват производството и поддържането на военни единици за по-нататъшно разширяване.

На полето има 32 специални зони, като "неутрални" в началото на играта са само 12 от тях. Обикновено те се завземат още в самото начало, след което силите са принудени да се борят помежду си за територията. В хода на играта участниците трябва да си сътрудничат, да преговарят, да си имат доверие и да се подкрепят взаимно, като същевременно се борят за възможно най-голямо поле.

За разлика от други настолни игри, ходовете в "Дипломация" се правят едновременно от играчите. Периодите са два - есен и пролет, а всеки от сезоните е разделен на няколко фази:

  • Фаза на дипломацията - играчите общуват, сключват съюзи (и открити, и тайни), обмислят стратегия или "подслушват" плановете на противниците;
  • Фаза на писане на заповеди - играчите пишат заповеди на хартийки, за да придвижат, подкрепят, транспортират войските си или да запазят позиции;
  • Фаза на изпълнение на заповедите - играчите прочитат своите заповеди и ги изпълняват, ако е възможно;
  • Фаза на отстъпление и разформироване - играчите извеждат разбитите в битката формации в безопасни територии;
  • Фаза на получаване и загуба на войски - играчите преценяват колко "центрове за поддръжка" контролират и губят военни части или, обратно, придобиват. Тази фаза се играе само през есента.

Как работи "Цицерон" (Cicero)?

В повечето традиционни настолни игри късметът често пъти е от значение. В "Дипломация" случаят не е точно такъв. Придвижването по полето е важен, но не и основен компонент на играта. В центъра е взаимодействието между играчите. "Държавните глави" на седемте сили преговарят, сключват съюзи, предават се едни други, мамят, блъфират - и всички тези умения са овладени от "Цицерон"

Алгоритъмът на изкуствен интелект, разработен от "Мета", е нещо като чатбот, базиран на два модула: обработка на естествен език и стратегическо мислене. Освен това има филтри, които оценяват "нискокачествените" реплики на диалога, които не отговарят на текущата ситуация на терена или не водят до постигане на поставената цел. Благодарение на тези компоненти "Цицерон" може да общува с опонентите си в играта, да предвижда действията им, да използва останалите играчи и да побеждава.

Езиковият модел на "Цицерон" включва 2,7 милиарда параметъра, взети от книги, новини, коментари в Reddit и гигански масив от данни от Common Crawl. Освен това инженерите на Meta са използвали данни от 125 000 онлайн игрови сесии, проведени в webDiplomacy.net. Благодарение на последния компонент от "обучението" си, алгоритъмът е научил 12,9 милиона реални съобщения, пряко свързани с играта.

"Мета" обяснява, че на тази база моделът може да имитира автентични съобщения, но не може да създава по-ефективни реплики въз основа на вече научените. С други думи - алгоритъмът блъфира, лъже, преговаря, "забива нож в гърба" по време на играта, подобно на реален човек, но не и по-добре от него. Инжерените впоследствие добавят опция изкуственият интелект да "вижда" и реалните намерения на играчите, "скрити" зад съобщенията, на база на които е обучен. Това помага да се контролира диалогът между изкуствения интелект и живия играч и позволява на "Цицерон" да анализира ситуацията на полето и вече проведените преговори, както и предвижда действията на другите.

Първоначално резултатът е, че казаното от "Цицерон" се разминава с действията му. Затова Meta разработва и алгоритъм, чрез който всеки ход в "Дипломация" се разглежда като отделна игра, в която участникът се стреми да предприеме някакво действие, за да постигне в крайна сметка определена цел. Алгоритъмът предсказва както целта, така и резултата - като "предполага", че реалният играч ще избере най-добрите възможности, с които разполага.

"Цицерон" обаче на практика не умее съвсем да лъже - затова често дава на противника си реални свои планове. "Мета" разработва и метод за оценка на съобщенията, които алгоритъмът изпраща до останалите играчи - в зависимост от това доколко вредят на самия него в играта. В крайна сметка той се нарежда сред най-добрите стратези в "Дипломация".

А защо изкуственият интелект трябва да играе настолна игра?

"Дипломация" е може би най-добрият "полигон" за обучение на изкуствен интелект в това да умее да убеждава, да преговаря, да сключва съюзи и да взаимодейства с човек, пишат авторите на "Медуза", анализирайки резултатите, показани от "Цицерон". От "Мета" пък дават възможност на желаещите да се запознаят с "Цицерон" и да го подобрят - да изпратят заявление до компанията. А тя на свой ред е готова да осигури достъп.

Засега "Цицерон" е подходящ само за игра на "Дипломация", но методите, използвани за създаването му, биха били приложими и в други области. Възможността за водене на смислен диалог с потребителя може да бъде полезна за развиване на гласовите асистенти, които сега могат да отговарят само на ясно зададени въпроси. Освен това ролята на алгоритъм като този би била полезна в образователния процес

Важно днес

Янаки Стоилов поиска от БНТ да смени цветовете на сутрешния блок с по-български

Визията на предаването е в синьо и жълто - цветовете на знамето на Украйна

11:11 - 29.04.2026
Важно днес

Масирана тролска кампания атакува украинската посланичка в САЩ

Жена, която взема бутилки алкохол след стрелбата във Вашингтон, беше невярно представена като Стефанишина

10:20 - 29.04.2026
Бизнес

Ръководството на "Магазин за хората" подаде оставка. Има ли схема “празни рафтове-пълни джобове“, пита кабинетът

Държавното дружество беше създаден по идея на Делян Пеевски

10:10 - 29.04.2026
Важно днес

Антон Кутев раздели Пеевски и Борисов и поиска сваляне на охраната само на лидера на ДПС

Според него решението за охраната не е директна работа на депутатите

10:07 - 29.04.2026
Важно днес

Клисурски: Редовното правителство не трябва да харчи пари за глупости

Според него спирането на излишно раздутите харчове може да спести стотици милиони

10:03 - 29.04.2026
Важно днес

Посланикът на САЩ в Украйна напуска поста си заради разногласия с Тръмп

Джули Дейвис ръководи временно посолството на САЩ в Киев от май миналата година

09:07 - 29.04.2026
Бизнес

Как Бяла черква, Никопол и Дряново изпревариха големите градове по ръст на мобилния трафик?

Когато връзката е стабилна, бърза и налична на повече места, хората започват да я използват по-смело.

08:50 - 29.04.2026
Важно днес

Обвиниха бившия директор на ФБР, че е заплашил Тръмп със снимка в Instagram

Джеймс Коми е публикувал снимка на раковини във формата на числата "86 47"

08:18 - 29.04.2026
Важно днес

Борислав Сарафов може да загуби и поста си в Националната следствена служба

Прокурорската колегия решава дали да започне дисциплинарно производство срещу него

07:52 - 29.04.2026