wiki:AGMFM - 5.6. Тјурингов тест

5.6. Тјурингов тест

Во вештачката интелигенција постои метод на испитување за утрвдување дали компјутерот е способен да размислува како човечко суштество. Овој тест е наречен Тјурингов тест, крстен по името на математичарот кој го измислил, Alan Turing. Тјуринговиот тест во неговата оригинална формулација претпоставува дека луѓето имаат ум, а природниот јазик е добра и доволна репрезентација за нивниот ум. Во овој тест се испитуваат и компјутерот и човекот, а компјутерот се смета за интелигентен доколку човековиот испитувач не може да направи разлика помеѓу нив.

Креативноста на компјутерот е подкатегорија на вештачката интелигенција, во која истражувачите преку имплементирање на програми за моделирање на креативноста автономно создаваат нови дела, кои се од вредност за подобрување на човековата креативност. Музички Тјуринг тест кој ќе ја оцени креативноста на делата не постои, но постојат предложени “музички Тјуринг тестови”, како на пример предложениот во следниов труд: Toward a musical Turing test for automatic music performance - Antonio Rodà , Emery Schubert , Giovanni De Poli , and Sergio Canazza. За да ја оценам креативноста на добиените мелодии од системот за автоматско генерирање на м. н. мелодија како урнек ќе го користам Тјуринг тестот предложен во претходно споменатиот труд.

Тјуринг тестот беше спроведен на следниот начин:

  • Избор на петмина испитаници без музичко познавање и петмина со музичко познавање, значи 10 испитаници поделени во две групи, група А и група Б, при што испитаниците не знаеја дека се поделени во групи.
  • Експериментот се изведуваше во домашни услови
  • На секој испитаник му беше доделен прашалник во писмена форма, со две прашања, дискутирани подоле
  • Двете групи добија различна верзија од прашалникот, односно на првата група во прашалникот стоеше дека треба да слушнат 5 мелодии, од кои една е изворна м. н. песна, а другите компјутерски генерирани мелодии, додека на втората група стоеше дека треба да слушнат 5 мелодии, од кои сите се компјутерски генерирани мелодии.
  • Од испитаниците потоа беше побарано да ја одберат мелодијата која најмногу звучи дека е човечка композиција, со одговарање на следното прашање:
    Пр. 1. “Која мелодија најмногу наликува на човечка?”
    • Мелодија 1 – mel-01.mid
    • Мелодија 2 – mel-02.mid
    • Мелодија 3 – mel-03.mid
    • Мелодија 4 – mel-04.mid
    • Мелодија 5 – mel-05.mid
    • Изворна м.н. песна е mel-03.mid, додека останатите мелодии се резултат на системот за автоматско генерирање на м.н. мелодија.
  • Откако одговорија на ова прашање требаше да го оценат нивото на сигурност при неговото одговарање, односно да одговорат на прашањето:
    Пр. 2. “Колку сте сигурни во вашиот одговор на претходното прашање?” ,
    со скала на одговори од 1 до 5, каде 1 означува “воопшто не сум сигурен/на”, а 5 означува “сигурен/на сум 100%

Tука треба да се наведат користените мелодии. Во печатената форма нивен нотен запис, а на сајтот може и нотниот запис и midi записот.

Мелодиите кои беа користени се следните:

Резултатите од прашањата се претставени во табела бр.2, односно испитаниците одговориле на следниов начин:

Испитаник = Пр.1. = = Пр.2. =
1 - Група А Мелодија 2 4
2 - Група А Мелодија 2 5
3 - Група А Мелодија 3 5
4 - Група А Мелодија 1 5
5 - Група А Мелодија 5 4
6 - Група Б Мелодија 4 4
7 - Група Б Мелодија 3 4
8 - Група Б Мелодија 3 5
9 - Група Б Мелодија 5 5
10 - Група Б Мелодија 1 5

Табела 2. Резултати од спроведениот “музички Тјуринг тест’ со десетмина испитаници

Од добиените резултати гледаме дека 3 испитаници ја препознале изворната мелодија, додека останатите 7 мислеле дека автоматски генерираните мелодии се човечки композиции, правејќи го изборот со високо ниво на сигурност, со оцени од 75-100% сигурност, односно оцени 4 и 5. Според ова повеќе од 50% неможеа да направат разлика помеѓу изворната и новокомпонираните мелодии, што значи резултатите се задоволителни, па системот е способен да генерира мелодии кои потсетуваат на македонски народни мелодии.

Од првата група на испитаници, која што беше составена од пет лица без претходно музичко знаење, четири од нив одговорија дека мелодиите генерирани од системот за автоматско генерирање на м. н. мелодија ги потсетуваат на м. н. мелодија создадена од човек, односно само на еден од нив изворната мелодија најмногу му наликувала на создадена од човек. Додека од петте испитаници со претходно музичко познавање, две лица ја одбрале изворната мелодија како мелодија која најмногу наликува дека е создадена од човек, а останатите тројца ги одбрале мелодиите генерирани од системот. Од ова можеме да изведеме дека повеќемина од одбраните испитаници не направиле разлика помеѓу делата создадени од човек и оние генерирани автоматски.

Како негативност на пристапот може да се напомене дека би било подобро овој тест да биде изведен на поголема група на испитаници, а воедно и со поразновидна група на луѓе, и како таков би бил поверодостоен. Тестот се смета за успешен доколку поголем број од испитаниците не можат да направат разлика помеѓу оригиналните дела и делата создадени од компјутер, со што се претпоставува дека компјутерот има способност за креативност. Овој тест не е музички Тјуринг тест, па доколку во иднина тој биде создаден би можело да се провери подобро креативноста на создадените музички дела.

Мислам дека треба на крајот да се продискутираат негативностите на пристапот како критика. На пример - прашањето ги наведува да се суспектни. Па ако испитаниците препознаваат некои песни, а не препознаваат некои други песни веднаш ќе направат елиминација и тоа ќе влијае на исходот. Можеби има и други негативности или специфични ситуации кои се појавиле на лице место при испитувањето што треба да се документираат во насока на подобрување на идни тестови.

Last modified 6 years ago Last modified on 03/18/19 23:24:32

Attachments (15)

Download all attachments as: .zip

Note: See TracWiki for help on using the wiki.