Ľudský protokol nanovo definuje trh s označením údajov a crowdsourcingom, aby sa dosiahla lepšia presnosť

Ľudský protokol nanovo definuje trh s označením údajov a crowdsourcingom, aby sa dosiahla lepšia presnosť

Artificial Intelligence (AI) môže splniť svoj účel iba vtedy, ak je vyškolený na vysokokvalitné údaje. Úspech algoritmu AI závisí vo veľkej miere od kvality a množstva použitých školiacich údajov. V súlade s tým by nemalo prekvapiť Vytvorenie projektu AI sa venuje optimalizácii údajov o tréningu

Väčšina projektov AI čelí zložitej úlohe zhromažďovania alebo nákupu vysokokvalitných údajov. Existuje niekoľko prípadov, keď projekty často končia nízkymi kvalitami údajov alebo výraznými údajmi. Zatiaľ čo v posledných rokoch bolo vytvorených niekoľko služieb identifikácie údajov, ktoré do istej miery čelia výzve, majú svoje vlastné problémy. Hlavnými dôvodmi výrazných údajov o nízkej kvalite sú napríklad ľudia, procesy alebo technológie používané na označovanie.

Ale čo presne sú označené údaje?

Dátové označenie: palivo pre modely AI

V súvislosti s AI sa označené údaje týkajú údajov, ktoré sú „označené alebo komentované“, aby model strojového učenia mohol predpovedať požadovaný výsledok. Vo všeobecnosti celý proces identifikácie údajov zvyčajne obsahuje niekoľko krokov, ako sú dátové komentáre, klasifikácia, označovanie, moderovanie a spracovanie.

Existuje niekoľko prístupov k označovaniu údajov, ktoré je možné buď používať nezávisle od seba alebo v kombinácii. Zahŕňa to interné označenie údajov, outsourcing, crowdsourcing a používanie strojov (pričom údaje sú označené pomocou algoritmov strojového učenia).

V závislosti od zložitosti problému projekty AI často používajú rozsiahle procesy označovania, aby previedli neoznačené údaje do výcvikových údajov, ktoré potrebujete naučiť svoje modely AI, ktoré možno identifikovať na vytvorenie požadovaného vydania.

z mnohých dostupných metód je crowdsourcing, v ktorom sa platforma tretích strán používa na prístup k veľkým množstvám ľudských pracovníkov súčasne, jednou z najčastejšie používanej taktiky projektov na identifikáciu údajov. V posledných rokoch sa okrem iného objavilo niekoľko platforiem ako Amazon Mturk, Appen Meeta Dash, Label Box a Tagog ako niektoré z najsľubnejších platforiem pre crowdsourcing ľudských pracovníkov na označenie údajov.

Avšak niekoľko projektov vyjadrilo obavy týkajúce sa kvality údajov o platformách crowdsourcingu. Napríklad, vezmite problém s kvalitou údajov s Amazon Mechanical Turk (MTURK), ktorý siaha do roku 2018. Mnoho výskumných pracovníkov údajov má podozrenie, že údaje využívajúce roboty okrem polovice a plne automatického kódu alebo skriptov boli identifikovaných s cieľom rýchlo podporovať ľudí v reakcii na určité súbory údajov.

Časť problému bola pripisovaná používateľom z rôznych miest, ktoré použili VPN na účasť v prieskumoch a dotazníkoch, ktoré neboli vhodné pre ich oblasť v oblasti. Pretože platformy crowdsourcingu platia ľudským pracovníkom primerane za dokončenie úloh, používatelia sa často zúčastňujú na dvojitých činnostiach, aby dosiahli väčší príjem. Napríklad niekoľko používateľov z rôznych krajín môže použiť VPN na účasť v programe identifikácie údajov, ktorý vyžaduje určité odpovede od amerických obyvateľov. To vedie k nižším a nezmyselným odpovediam, ktoré zase znižujú kvalitu údajov.

Ak sa predkladajú údaje s nízkou kvalitou, vyvoláva to vážne otázky týkajúce sa existujúceho procesu zabezpečenia kvality. Pretože väčšina existujúcich platforiem crowdsourcingu na identifikáciu údajov je silne centralizovaná, je takmer nemožné posúdiť kvalitu a pracovný tok. Všetky tieto problémy spojené s kométkovým rastom technológie blockchain, vydláždili cestu pre decentralizované a schvaľovacie riešenia crowdsourcing.

Tu ľudský protokol predstavuje nový nový prístup k označovaniu údajov vytvorením infraštruktúry, ktorá podporuje trhy práce bez povolení, ktoré tiež poskytujú ľudským pracovníkom prácu a poskytujú organizáciám prístup k pracovníkom-a nie bez centrálnych sprostredkovateľov.

Uľahčenie trhov bez schvaľovania

Human Protocol Human Protocol je prirodzene decentralizovaná a automatizovaná infraštruktúra s otvoreným zdrojom, ktorá ponúka hybridný rámec pre organizáciu, hodnotenie a odmeňovanie ľudskej práce. Ľudský protokol slúži záujmom zamestnancov aj zamestnávateľov. Výsledkom je, že sa dá použiť v rôznych aplikáciách vrátane projektov založených na koncertoch a koncertoch.

Aj keď je ľudský protokol takmer univerzálne použiteľný, najprv sa zameriava na podporu decentralizovaných trhov v súvislosti so strojovým učením (ML). Presnejšie povedané, ľudský protokol uľahčuje zaznamenávanie obrovského množstva vysoko kvalitných údajov o ľudských komentároch pri zachovaní optimálnych úrovní služieb.

Zatiaľ čo ľudský protokol sa pôvodne objavil z HCAPTCHA, jedného z najpopulárnejších a najbohatších služieb CAPTCHA na Web 2.0, platforma sa odvtedy etablovala ako úplne jedinečná jednotka ponúkaním základnej technológie na podporu všetkých trhových trhov, na ktorých takmer každé identifikácie údajov inklózie údajov-crowdsourcing.

Trh s ľudskými pracovnými miestami v súčasnosti ponúka trhy s asistenciou pre video, imidžu a textovú pomoc, na ktorých sú kupujúci a predávajúci spájaní. Základný protokol môže rozdeliť prácu (úlohu) na mnohé z týchto trhov a poslať ju na príslušné výmeny (aplikácie, ktoré pracovníci používajú na vykonávanie úlohy). Okrem toho môže pôsobiť proti údajom na všetkých trhoch s pracovnými miestami, aby sa zabezpečila kvalita.

Okrem toho tím Human Protocol vybral najlepšie dostupné nástroje pre každý trh práce. Vyvinuli výmeny a neustále ich optimalizujú, aby zamestnancom ponúkli všetko, čo potrebujú na dokončenie požadovaných úloh. Protokol obsahuje aj nástroje, ktoré udržiavajú kontrolu kvality end-to-end nad prenášanými úlohami. To účinne znamená, že požiadavky dostávajú deterministickejší výsledok, ak sa podobné úlohy vykonávajú pri rovnakej výmene.

Koniec koncov, ľudský protokol ponúka úplne otvorené riešenie v porovnaní so silne centralizovanými a mikro riadenými platformami, ktoré umožňujú rôznym projektom využívať svoju infraštruktúru. Okrem toho ponúka tiež možnosť pomôcť projektom pridať vaše vlastné nástroje, aby splnili požiadavky na označovanie údajov presnejšie, efektívnejšie a bez sprostredkovateľských predajcov. Najdôležitejšia vec je, že zoznam, distribúcia a odmeňovanie pracovných miest je automatizovaný okrem miliónov mikroplatkov vďaka uplatňovaniu technológie blockchain protokolu na uľahčenie transakcií a fakturácie za usporiadané, spoľahlivé a spravodlivé spôsoby.


Zdroj: Crypto-news-flash.com

Kommentare (0)