Az emberi protokoll újradefiniálja az adatjelzés és a tömegforrás piacát a jobb pontosság elérése érdekében

Az emberi protokoll újradefiniálja az adatjelzés és a tömegforrás piacát a jobb pontosság elérése érdekében

A mesterséges intelligencia (AI) csak akkor tudja teljesíteni a célját, ha kiváló minőségű adatokra képzett. Az AI algoritmus sikere nagymértékben függ a felhasznált képzési adatok minőségétől és mennyiségétől. Ennek megfelelően nem szabad meglepnie Az AI projekt létrehozása az edzési adatok optimalizálására szolgál

A legtöbb AI-projektnek a nehéz feladatának nehéz feladata, hogy gyűjtsön vagy vásároljon. Számos esetben a projektek gyakran alacsony minőségű adatokkal vagy jelölt adatokkal végződnek. Míg az utóbbi években számos adat -azonosító szolgáltatást hoztak létre, amelyek bizonyos mértékben szembesülnek a kihívással, saját problémáik vannak. Az alacsony minőségű jelölt adatok fő okai például a címkézéshez használt emberek, folyamatok vagy technológiák.

De mi pontosan a címkézett adatok?

Adatok jelölése: Az üzemanyag az AI modellekhez

Az AI-vel kapcsolatban a jelölt adatok a "megjelölt vagy kommentált" adatokhoz kapcsolódnak, hogy egy gépi tanulási modell megjósolja a kívánt eredményt. Általában véve a teljes adatmeghatározási folyamat általában több lépést tartalmaz, például az adatmegjegyzés, az osztályozás, a címkézés, a moderálás és a feldolgozás.

Az adatok címkézésének számos megközelítése létezik, amelyek egymástól függetlenül használhatók, vagy kombinálva. Ez magában foglalja a belső adatjelölést, a kiszervezés, a tömegforrás és a gépek használatát (amelynek során az adatokat gépi tanulási algoritmusok segítségével címkézik).

A probléma bonyolultságától függően az AI projektek gyakran kiterjedt címkézési folyamatokat használnak annak érdekében, hogy a nem címkézett adatokat olyan képzési adatokká alakítsák, amelyekre szükség van az AI modellek tanításához, amely azonosítható a kívánt kiadás létrehozásához.

A sok rendelkezésre álló módszer a tömegforrásból származó, amelyben egy harmadik fél platformját használják nagy mennyiségű emberi munkavállaló hozzáférésére egyszerre, az egyik leggyakrabban használt projektek taktikája az adatok azonosításához. Az utóbbi években többek között számos olyan platform, mint például az Amazon Mturk, az Appen Meeta Dash, a Label Box és a Tagog, a legígéretesebb platformok jelentkeztek az emberi munkavállalók tömeges forrású adatjelzésére.

Számos projekt aggodalmát fejezte ki a tömegforrás-platformok adatminőségével kapcsolatban. Például vegye figyelembe az adatminőségi problémát az Amazon Mechanical Turk (MTURK) -nel, amely 2018 -ra nyúlik vissza. Számos adatkutató gyanítja, hogy a botok felhasználásával a fele és a teljesen automatikus kód vagy szkriptek mellett az adatokat azonosítják annak érdekében, hogy az embereket az egyes adatkészletekre gyors reakcióban támogassák.

A probléma egy részét a különböző helyszíneken lévő felhasználóknak tulajdonították, amelyek VPN-eket használtak a felmérésekben és a kérdőívekben, amelyek nem voltak alkalmasak területi rendszerükhöz. Mivel a tömegforrás -platformok megfelelő módon fizetik az emberi munkavállalókat a feladatok elvégzéséért, a felhasználók gyakran részt vesznek kettős tevékenységekben a több jövedelem elérése érdekében. Például a különböző országokból származó számos felhasználó felhasználhatja a VPN -t egy olyan adat -azonosító programban való részvételhez, amely bizonyos válaszokat igényel az amerikai lakosoktól. Ez alacsonyabbrendű és értelmetlen válaszokhoz vezet, ami viszont csökkenti az adatminőséget.

Ha alacsony minőségű adatokat benyújtanak, ez komoly kérdéseket vet fel a meglévő minőségbiztosítási folyamatról. Mivel az adatok azonosítására szolgáló meglévő tömegforrás -platformok többsége erősen központosított, szinte lehetetlen felmérni a minőséget és a munkafolyamatot. Mindezek a problémák, amelyek párosítva a blokklánc-technológia üstökös-szerű növekedésével, előkészítették az utat a decentralizált és jóváhagyás nélküli tömegforrás-megoldásokhoz.

Itt az emberi protokoll új új megközelítést mutat be az adatok címkézéséhez olyan infrastruktúra létrehozásával, amely támogatja az engedély nélküli munkaerőpiacokat, amelyek szintén biztosítják az emberi munkavállalókat, és a szervezetek számára hozzáférést biztosítanak a munkavállalók számára-központi közvetítők nélkül.

A jóváhagyás nélküli munkaerőpiacok megkönnyítése

Human Protocol

Az emberi protokoll természetesen decentralizált és automatizált nyílt forráskódú infrastruktúra, amely hibrid keretet kínál az emberi munka szervezéséhez, értékeléséhez és javadalmazásához. Az emberi protokoll mind a munkavállalók, mind a munkáltatók érdekeit szolgálja. Ennek eredményeként különféle alkalmazásokban is felhasználható, ideértve a tömegforrás és a koncert alapú projekteket is.

Bár az emberi protokoll szinte egyetemesen alkalmazható, először a decentralizált piacok támogatására összpontosít a gépi tanulással kapcsolatban (ML). Pontosabban, az emberi protokoll megkönnyíti a hatalmas mennyiségű, kiváló minőségű emberi megjegyzés adatainak rögzítését, miközben megőrzi az optimális szolgáltatási szinteket.

míg az emberi protokoll eredetileg a Hcaptcha-ból származott, az egyik legnépszerűbb és tesztelt Captcha-szolgáltatásból a Web 2.0-on, a platform azóta teljesen egyedi egységként alakult ki azáltal, hogy az alapul szolgáló technológiát kínálja, amelynek támogatására szolgál a minden forduló piacának támogatására, amelyben szinte minden feladatba foglaló adatok azonosítása-a tömegközlemények.

Az emberi munkaerőpiac jelenleg video-, imázs- és szöveges támogatási piacokat kínál, amelyeken a vásárlók és az eladók összehoznak. Az alapul szolgáló protokoll feloszthatja a munkát (feladatot) ezeknek a piacoknak a nagy részére, és elküldheti a megfelelő tőzsdéknek (az alkalmazások, amelyeket a munkavállalók a munka elvégzésére használnak). Ezenkívül a minőség biztosítása érdekében ellensúlyozhatja az összes munkaerőpiac adatait.

Ezenkívül az emberi protokoll csapata minden munkaerőpiacra a rendelkezésre álló legjobb eszközöket választotta. Fejlesztették ki a cseréket, és folyamatosan optimalizálják őket, hogy mindent felajánljanak az alkalmazottaknak, amire szükségük van a kért feladatok elvégzéséhez. A protokoll olyan eszközöket is tartalmaz, amelyek fenntartják a végpontok közötti minőség-ellenőrzést az átadott feladatok felett. Ez ténylegesen azt jelenti, hogy a kérések determinisztikusabb eredményt kapnak, ha hasonló munkahelyeket végeznek ugyanazon csere körül.

Végül is az emberi protokoll teljesen nyitott megoldást kínál az erősen központosított és mikro-kezelésű platformokhoz képest, amely lehetővé teszi a különféle projektek számára az infrastruktúra használatát. Ezenkívül lehetőséget kínál arra is, hogy segítse a projekteket a saját eszközök hozzáadásában, hogy megfeleljen az adatok címkézési követelményeinek pontosabban, hatékonyabban és a közép -kereskedők nélkül. A legfontosabb dolog az, hogy a feladatok tőzsdei tőzsdei tőzsdei jegyzése, elosztása és javadalmazása több millió mikrofinanszírozás mellett automatizált, a protokoll blokklánc-technológiájának alkalmazásának köszönhetően, hogy megkönnyítsék a tranzakciókat és a számlázást a rendezett, megbízható és tisztességes módon.


Forrás: Crypto-rews-flash.com

Kommentare (0)