Protocolul uman redefinește piața pentru marcarea datelor și aglomerarea pentru a obține o precizie mai bună

Protocolul uman redefinește piața pentru marcarea datelor și aglomerarea pentru a obține o precizie mai bună

Inteligența artificială (AI) nu poate îndeplini scopul său numai dacă este instruit pe date de înaltă calitate. Succesul unui algoritm AI depinde în mare măsură de calitatea și cantitatea datelor de instruire utilizate. În consecință, nu ar trebui să surprindă Crearea unui proiect AI este dedicată optimizării datelor de instruire

Majoritatea proiectelor AI se confruntă cu sarcina dificilă de a colecta sau achiziționa date de înaltă calitate. Există mai multe cazuri în care proiectele se termină adesea cu date de calitate scăzută sau date marcate. În timp ce mai multe servicii de identificare a datelor au fost create în ultimii ani care se confruntă într -o anumită măsură, acestea au propriile probleme. Principalele motive pentru date marcate de calitate scăzută sunt, de exemplu, oamenii, procesele sau tehnologiile utilizate pentru etichetare.

Dar ce sunt exact datele etichetate?

Marcarea datelor: combustibilul pentru modelele AI

În legătură cu AI, datele marcate se referă la datele „marcate sau comentate”, astfel încât un model de învățare automată poate prezice rezultatul dorit. În general, întregul proces de identificare a datelor include de obicei mai mulți pași, cum ar fi comentarii de date, clasificare, etichetare, moderare și procesare.

Există mai multe abordări ale etichetării datelor care pot fi utilizate independent unul de celălalt sau în combinație. Aceasta include marcarea datelor interne, externalizarea, crowdsourcing -ul și utilizarea mașinilor (prin care datele sunt etichetate folosind algoritmi de învățare automată).

În funcție de complexitatea problemei, proiectele AI folosesc adesea procese extinse de etichetare pentru a converti datele etichetate care nu sunt etichetate în datele de instruire de care aveți nevoie pentru a învăța modelele AI, care pot fi identificate pentru a crea ediția dorită.

Dintre numeroasele metode disponibile este crowdsourcing, în care o platformă terță parte este utilizată pentru a accesa cantități mari de lucrători umani în același timp, una dintre cele mai frecvent utilizate tactici ale proiectelor pentru identificarea datelor. În ultimii ani, printre altele, mai multe platforme precum Amazon Mturk, Appen Meeta Dash, Label Box și Tagog au apărut ca unele dintre cele mai promițătoare platforme pentru aglomerarea lucrătorilor umani pentru marcarea datelor.

Cu toate acestea, mai multe proiecte și-au exprimat îngrijorarea cu privire la calitatea datelor platformelor de crowdsourcing. De exemplu, luați problema calității datelor cu Amazon Mechanical Turk (MTURK), care se întoarce în 2018. Mulți cercetători de date suspectează că datele folosind roboți în plus față de jumătate și cod sau scripturi complet automate au fost identificate pentru a sprijini oamenii în reacție rapid la anumite seturi de date.

O parte a problemei a fost atribuită utilizatorilor din diferite locații care au folosit VPN-urile pentru a participa la sondaje și chestionare care nu erau potrivite pentru schema de zonă. Deoarece platformele de crowdsourcing plătesc lucrătorii umani în mod corespunzător pentru finalizarea sarcinilor, utilizatorii participă adesea la activități duble pentru a obține mai mult venit. De exemplu, o serie de utilizatori din diferite țări pot utiliza VPN pentru a participa la un program de identificare a datelor care necesită anumite răspunsuri din partea rezidenților americani. Acest lucru duce la răspunsuri inferioare și nesensibile, care la rândul lor scade calitatea datelor.

Dacă sunt transmise date de calitate scăzută, acest lucru ridică întrebări serioase cu privire la procesul de asigurare a calității existent. Deoarece majoritatea platformelor de crowdsourcing existente pentru identificarea datelor sunt puternic centralizate, este aproape imposibil de evaluat calitatea și fluxul de lucru. Toate aceste probleme, împerecheate cu creșterea asemănătoare cu cometa a tehnologiei blockchain, au deschis calea pentru soluții de crowdsourcing descentralizate și fără aprobare.

Aici Protocolul uman prezintă o nouă abordare nouă în ceea ce privește etichetarea datelor prin crearea unei infrastructuri care să sprijine piețele de muncă fără permisiune care oferă lucrătorilor umani munca și oferă organizațiilor acces la lucrători-tot fără intermediari centrali.

Facilitarea piețelor de locuri de muncă fără aprobare

Protocol uman

Protocolul uman este în mod natural o infrastructură descentralizată și automatizată, care oferă un cadru hibrid pentru organizare, evaluare și remunerare a muncii umane. Protocolul uman servește atât interesele angajaților, cât și ale angajatorilor. Drept urmare, poate fi utilizat într-o varietate de aplicații, inclusiv proiecte bazate pe aglomerare și bazate pe concerte.

Deși protocolul uman este aproape universal aplicabil, se concentrează mai întâi pe sprijinul piețelor descentralizate în legătură cu învățarea automată (ML). Pentru a fi mai precis, protocolul uman facilitează înregistrarea unor cantități uriașe de date de comentarii umane de înaltă calitate, menținând în același timp niveluri optime de servicii.

În timp ce protocolul uman a apărut inițial de la HCAPTCHA, unul dintre cele mai populare și testate servicii CAPTCHA pe Web 2.0, platforma s-a stabilit de atunci ca o unitate complet unică, oferind tehnologia de bază pentru a sprijini piețele de toate cele care pot să fie aproape fiecare sarcină care să includă identificarea datelor-crowdsourcing.

Piața muncii umane oferă în prezent piețe de asistență video, imagini și text pe care sunt reunite cumpărătorii și vânzătorii. Protocolul de bază poate împărți un loc de muncă (sarcină) la multe dintre aceste piețe și îl poate trimite la schimburile corespunzătoare (aplicațiile pe care lucrătorii le folosesc pentru a face treaba). În plus, poate contracara datele de pe toate piețele de locuri de muncă pentru a asigura calitatea.

În plus, echipa de protocol uman a selectat cele mai bune instrumente disponibile pentru fiecare piață de locuri de muncă. Au dezvoltat schimburile și le -au optimizat continuu pentru a oferi angajaților tot ceea ce au nevoie pentru a finaliza sarcinile solicitate. Protocolul conține, de asemenea, instrumente care mențin un control de calitate end-to-end asupra lucrărilor transmise. Acest lucru înseamnă în mod efectiv că cererile primesc un rezultat mai determinist dacă se efectuează locuri de muncă similare în același schimb.

La urma urmei, Protocolul uman oferă o soluție complet deschisă în comparație cu platformele puternic centralizate și micro-gestionate, ceea ce permite o varietate de proiecte pentru a-și folosi infrastructura. În plus, oferă, de asemenea, posibilitatea de a ajuta proiectele să adauge propriile instrumente pentru a îndeplini cerințele pentru etichetarea datelor mai precis, eficient și fără dealeri intermediari. Cel mai important este că listarea, distribuția și remunerația locurilor de muncă este automatizată pe lângă milioane de micro-plăți, datorită aplicării tehnologiei blockchain a protocolului, pentru a facilita tranzacțiile și facturarea pentru o modalitate ordonată, fiabilă și corectă.


Sursa: Crypto-news-flash.com

Kommentare (0)