Lidský protokol předefinuje trh s označením dat a crowdsourcingu, aby se dosáhlo lepší přesnosti
Lidský protokol předefinuje trh s označením dat a crowdsourcingu, aby se dosáhlo lepší přesnosti
umělá inteligence (AI) může splnit svůj účel, pouze pokud je vyškolen na vysoce kvalitních datech. Úspěch algoritmu AI do značné míry závisí na kvalitě a množství použitých údajů o školení. V souladu s tím by neměla překvapit Vytvoření projektu AI je věnováno optimalizaci dat tréninku
Většina projektů AI čelí obtížnému úkolu shromažďování nebo nákupu vysoce kvalitních dat. Existuje několik případů, kdy projekty často končí údaji o nízké kvalitě nebo označenými údaji. Zatímco v posledních letech bylo vytvořeno několik služeb identifikace dat, které čelí výzvě do určité míry, mají své vlastní problémy. Hlavními důvody pro výrazná data o nízké kvalitě jsou například lidé, procesy nebo technologie používané pro označování.
ale co přesně jsou označena data?
označení dat: palivo pro modely AI
V souvislosti s AI se označená data týkají dat, která jsou „označena nebo komentována“, aby model strojového učení mohl předpovídat požadovaný výsledek. Obecně celý proces identifikace dat obvykle zahrnuje několik kroků, jako je komentář k datům, klasifikace, značení, moderování a zpracování.
Existuje několik přístupů k označování dat, které lze použít buď nezávisle na sobě nebo v kombinaci. To zahrnuje interní označení dat, outsourcing, crowdsourcing a použití strojů (přičemž data jsou označena pomocí algoritmů strojového učení).
V závislosti na složitosti problému projekty AI často používají rozsáhlé procesy označování, aby převedly nenaznačená data na tréninková data, která potřebujete k výuce vašich modelů AI, které lze identifikovat k vytvoření požadovaného vydání.
Z mnoha dostupných metod je crowdsourcing, ve kterém se platforma třetí strany používá k přístupu k velkému množství lidských pracovníků současně, což je jedna z nejčastěji používaných taktik projektů k identifikaci dat. V posledních letech se v posledních letech objevilo několik platforem, jako jsou Amazon Mturk, Appen Meeta Dash, Label Box a Tagog, některé z nejslibnějších platforem pro crowdsourcing lidských pracovníků pro označení dat.
Několik projektů však vyjádřilo obavy z kvality dat platforem crowdsourcingu. Vezměte například problém kvality dat s Amazon Mechanical Turk (MTURK), který se vrací zpět k roku 2018. Mnoho vědců z dat má podezření, že data využívající roboty kromě poloviny a plně automatického kódu nebo skriptů byly identifikovány, aby rychle podpořily lidi v reakci na určité datové sady.
Část problému byla připsána uživatelům z různých míst, která používala VPN k účasti na průzkumech a dotaznících, které nebyly vhodné pro jejich schéma v oblasti. Vzhledem k tomu, že platformy crowdsourcingu platí lidským pracovníkům přiměřeně za dokončení úkolů, uživatelé se často účastní dvojitých aktivit, aby dosáhli většího příjmu. Například řada uživatelů z různých zemí může použít VPN k účasti na programu identifikace dat, který vyžaduje určité odpovědi amerických obyvatel. To vede k podřadným a nesmyslným odpovědím, což zase snižuje kvalitu dat.
Pokud jsou předložena data nízké kvality, vyvolává to vážné otázky o stávajícím procesu zajištění kvality. Protože většina stávajících platforem crowdsourcingu pro identifikaci dat je silně centralizovaná, je téměř nemožné posoudit kvalitu a pracovní postup. Všechny tyto problémy, spárované s růstem technologie blockchainu podobného kometám, vydláždily cestu pro decentralizované a bez schválení crowdsourcingových řešení.
Zde lidský protokol představuje nový nový přístup k označování dat vytvořením infrastruktury, která podporuje trhy bez povolení, které také poskytují lidským pracovníkům práci a poskytují organizacím přístup k pracovníkům bez centrálních zprostředkovatelů.
Ačkoli je lidský protokol téměř všeobecně použitelný, nejprve se zaměřuje na podporu decentralizovaných tržišť v souvislosti s strojovým učením (ML). Přesněji řečeno, lidský protokol usnadňuje zaznamenávání obrovského množství vysoce kvalitních údajů o lidských komentářích při zachování optimálních úrovní služeb. Když se lidský protokol původně vynořil z HCAPTCHA, jedné z nejpopulárnějších a testovaných služeb Captcha na webu 2.0, platforma se od té doby etablovala jako zcela jedinečná jednotka tím, že nabízí základní technologii, která podporuje všestranné trhy, v níž je možné, že je možné. Trh s lidským prací v současné době nabízí trhy s videem, obrazem a textem, na kterých jsou kupující a prodejci spojeni. Základní protokol může rozdělit úlohu (úkol) na mnoho z těchto trhů a poslat ji na odpovídající burzy (aplikace, které pracovníci používají k práci). Kromě toho může působit proti údajům na všech pracovních trzích, aby byla zajištěna kvalita. Kromě toho tým Human Protocol vybral nejlepší dostupné nástroje pro každý trh práce. Vyvinuli burzy a neustále je optimalizují tak, aby nabízely zaměstnancům vše, co potřebují k dokončení požadovaných úkolů. Protokol také obsahuje nástroje, které udržují kontrolu kvality koncového toku nad vysílanými úlohami. To účinně znamená, že požadavky obdrží determinističtější výsledek, pokud jsou podobné úlohy prováděny přibližně stejnou výměnu. lidský protokol nabízí zcela otevřené řešení ve srovnání se silně centralizovanými a mikro spravovanými platformami, které umožňují různé projekty používat svou infrastrukturu. Kromě toho také nabízí možnost pomoci projektům přidat vlastní nástroje pro splnění požadavků na označování dat přesněji, efektivněji a bez mezilehlých prodejců. Nejdůležitější věcí je, že výpis, distribuce a odměňování pracovních míst je automatizován kromě milionů mikropodniků díky aplikaci technologie blockchainu protokolu za účelem usnadnění transakcí a fakturace za řádný, relativní a spravedlivý způsob.
usnadnění pracovních trhů bez schválení
Kommentare (0)