Ljudski protokol redefinira tržište označavanja podataka i gužve kako bi postigao bolju točnost
Ljudski protokol redefinira tržište označavanja podataka i gužve kako bi postigao bolju točnost
Umjetna inteligencija (AI) može ispuniti svoju svrhu samo ako je obučena za podatke visoke kvalitete. Uspjeh AI algoritma u velikoj mjeri ovisi o kvaliteti i količini korištenih podataka o treningu. U skladu s tim, to ne bi trebalo iznenaditi
Većina AI projekata suočena je s teškim zadatkom prikupljanja ili kupnje visokokvalitetnih podataka. Postoji nekoliko slučajeva u kojima se projekti često završavaju s podacima niske kvalitete ili označenim podacima. Iako je posljednjih godina stvoreno nekoliko usluga identifikacije podataka koje se u određenoj mjeri suočavaju s izazovom, oni imaju svoje probleme. Glavni razlozi označenih podataka o niskoj kvaliteti su, na primjer, ljudi, procesi ili tehnologije koje se koriste za označavanje.
Ali što su točno označeni podaci?
Označavanje podataka: gorivo za AI modele
U vezi s AI, označeni podaci odnose se na podatke koji su "označeni ili komentirani" tako da model strojnog učenja može predvidjeti željeni rezultat. Općenito, cjelokupni postupak identifikacije podataka obično uključuje nekoliko koraka, poput komentara podataka, klasifikacije, označavanja, umjerenosti i obrade.
Postoji nekoliko pristupa označavanju podataka koji se mogu koristiti neovisno jedni o drugima ili u kombinaciji. To uključuje interne oznake podataka, outsourcing, crowdsourcing i upotrebu strojeva (pri čemu se podaci označavaju pomoću algoritama strojnog učenja).
Ovisno o složenosti problema, AI projekti često koriste opsežne procese označavanja kako bi pretvorili podatke koji nisu označeni u podatke o treningu koji trebate naučiti svoje AI modele, koji se mogu identificirati za stvaranje željenog izdanja.
od mnogih dostupnih metoda je crowdsourcing, u kojem se platforma treće strane koristi za pristup velikim količinama ljudskih radnika istovremeno, jedna od najčešće korištenih taktika projekata za identificiranje podataka. Posljednjih godina, između ostalog, nekoliko platformi kao što su Amazon Mturk, Appen Meeta Dash, Box etiketa i Tagog pojavilo se kao neke od najperspektivnijih platformi za gužve na ljudskim radnicima za označavanje podataka.
Međutim, nekoliko je projekata izrazilo zabrinutost zbog kvalitete podataka platformi za gužve. Na primjer, uzmite problem s kvalitetom podataka s Amazon Mechanical Turk (MTURK), koji seže do 2018. godine. Mnogi istraživači podataka sumnjaju da su podaci koji koriste botove uz polovinu i potpuno automatski kod ili skripte identificirani kako bi brzo podržali ljude u reakciji na određene skupove podataka.
Dio problema pripisan je korisnicima s različitih lokacija koji su koristili VPN-ove za sudjelovanje u anketama i upitnicima koji nisu bili prikladni za njihovu shemu područja. Budući da platforme za gužve na odgovarajući način plaćaju ljudske radnike za završetak zadataka, korisnici često sudjeluju u dvostrukim aktivnostima kako bi postigli više prihoda. Na primjer, brojni korisnici iz različitih zemalja mogu koristiti VPN za sudjelovanje u programu identifikacije podataka koji zahtijeva određene odgovore američkih stanovnika. To dovodi do inferiornih i besmislenih odgovora, što zauzvrat snižava kvalitetu podataka.
Ako se podnose podaci niske kvalitete, to postavlja ozbiljna pitanja o postojećem postupku osiguranja kvalitete. Budući da je većina postojećih crowdsourcing platformi za identifikaciju podataka snažno centralizirana, gotovo je nemoguće procijeniti kvalitetu i tijek rada. Svi ovi problemi, upareni s rastom blockchain tehnologije poput kometa, otvorili su put za decentralizirana rješenja za gužva u gužvi bez odobrenja.
Ovdje ljudski protokol predstavlja novi novi pristup označavanju podataka stvaranjem infrastrukture koja podržava tržišta rada bez dopuštenja koja također pružaju ljudskim radnicima rad i pruža organizacijama pristup radnicima bez središnjih posrednika.
Ljudski protokol je prirodno decentralizirana i automatizirana infrastruktura otvorenog koda koja nudi hibridni okvir za organizaciju, procjenu i naknadu ljudskog rada. Ljudski protokol služi i interesima zaposlenika i poslodavaca. Kao rezultat toga, može se koristiti u raznim aplikacijama, uključujući projekti koji se temelje na gužvi i projekti. Iako je ljudski protokol gotovo univerzalno primjenjiv, prvo se fokusira na podršku decentraliziranih tržišta u vezi s strojnim učenjem (ML). Da budemo precizniji, ljudski protokol olakšava snimanje ogromnih količina visokokvalitetnih podataka o ljudskim komentarima uz održavanje optimalnih razina usluge. Dok je ljudski protokol izvorno izlazio iz HCAPTCHA, jedne od najpopularnijih i najpopularnijih i testiranih Captcha usluga na Web 2.0, platforma se od tada etablirala kao potpuno jedinstvena jedinica nudeći temeljnu tehnologiju za podršku sveobuhvatnim tržištima u kojima se gotovo svaki zadatak identificira. Ljudsko tržište rada trenutno nudi tržišta video, slika i tekstualne pomoći na kojima se kupci i prodavači okupljaju. Temeljni protokol može podijeliti posao (zadatak) na mnoga od ovih tržišta i poslati ga na odgovarajuće razmjene (aplikacije koje radnici koriste za obavljanje posla). Osim toga, može se suprotstaviti podacima na svim tržištima radnih mjesta kako bi se osigurala kvaliteta. Osim toga, tim za ljudske protokol odabrao je najbolje dostupne alate za svako tržište rada. Razvili su razmjene i kontinuirano ih optimizirali kako bi zaposlenicima ponudili sve što im je potrebno da ispune tražene zadatke. Protokol također sadrži alate koji održavaju krajnju kontrolu kvalitete nad prenesenim poslovima. To učinkovito znači da zahtjevi dobivaju determinističniji rezultat ako se obavljaju slični poslovi o istoj razmjeni. Napokon, ljudski protokol nudi potpuno otvoreno rješenje u usporedbi s snažno centraliziranim i mikro-upravljanim platformama, što omogućuje raznim projektima da koriste svoju infrastrukturu. Pored toga, nudi i mogućnost pomoći projektima da dodaju svoje vlastite alate kako bi ispunili zahtjeve za preciznije, učinkovitije i bez srednjih prodavača. Najvažnije je da se uvrštavanje, distribucija i naknada radnih mjesta automatizira uz milijune mikro plaćanja, zahvaljujući primjeni blockchain tehnologije protokola, kako bi se olakšale transakcije i naplata za uredan, pouzdan i pravičan način.
olakšavanje tržišta radnih mjesta bez odobrenja
Kommentare (0)