Inimese protokoll määratleb andmete märgistamise ja rahvahulga turunduse uuesti, et saavutada parem täpsus
Inimese protokoll määratleb andmete märgistamise ja rahvahulga turunduse uuesti, et saavutada parem täpsus
tehisintellekt (AI) saab oma eesmärki täita ainult siis, kui seda koolitatakse kvaliteetsete andmetega. AI algoritmi edu sõltub suuresti kasutatavate koolitusandmete kvaliteedist ja kogusest. Sellest tulenevalt ei tohiks see üllatada AI projekti loomine on pühendatud treeningandmete optimeerimisele Enamik AI-projekte seisab silmitsi keeruliste andmete kogumise või ostmise keerulise ülesandega. On mitmeid juhtumeid, kus projektid lõppevad sageli madala kvaliteediga andmete või märgistatud andmetega. Kuigi viimastel aastatel on loodud mitu andmete tuvastamisteenust, mis seisavad teatud määral silmitsi väljakutsega, on neil oma probleemid. Madala kvaliteediga märkimisväärsete andmete peamised põhjused on näiteks märgistamiseks kasutatavad inimesed, protsessid või tehnoloogiad.
Aga mis täpselt on märgistatud andmed?
Andmemärgistus: AI mudelite kütus
seoses AI-ga seotud andmed on seotud andmetega, mis on "tähistatud või kommenteeritud", nii et masinõppe mudel saaks soovitud tulemust ennustada. Üldiselt sisaldab kogu andmete tuvastamise protsess tavaliselt mitmeid etappe, näiteks andmete kommentaar, klassifitseerimine, sildistamine, modereerimine ja töötlemine.
Andmete märgistamisel on mitu lähenemisviisi, mida saab kasutada üksteisest sõltumatult või kombinatsioonis. See hõlmab sisemist andmete märgistamist, allhankeid, rahvahulga allhankeid ja masinate kasutamist (seetõttu on andmed märgistatud masinõppe algoritmide abil).
Sõltuvalt probleemi keerukusest kasutavad AI projektid sageli ulatuslikke märgistamisprotsesse, et teisendada märgistatud andmed koolitusandmeteks, mida vajate oma AI-mudelite õpetamiseks, mida saab tuvastada soovitud väljaande loomiseks.
paljude saadaolevate meetodite hulgast on rahvahulk, milles kolmanda osapoole platvormi kasutatakse samal ajal suures koguses inimtöötajaid, mis on andmete tuvastamiseks üks kõige sagedamini kasutatavaid taktikaid. Viimastel aastatel on muu hulgas mitmeid platvorme nagu Amazon Mturk, Appen Meeta Dash, Label Box ja Tagog kujunenud mõne lootustandvaima platvormina, mis võimaldaks inimtöötajaid andmete märgistamiseks.
Kuid mitmed projektid on väljendanud muret rahvahulgahangete platvormide andmete kvaliteedi pärast. Näiteks võtke andmete kvaliteediprobleem Amazon Mechanical Turk (MTurk), mis ulatub tagasi 2018. aastasse. Paljud andmepõhimõtted kahtlustavad, et lisaks poole ja täisautomaatse koodi või skriptide robotite kasutamise andmed tuvastati, et toetada teatud andmekogumite reaktsioonis olevaid inimesi.
Osa probleemist omistati kasutajatele erinevatest kohtadest, kus kasutasid VPN-e uuringutes ja küsimustikes osalemiseks, mis ei sobinud nende piirkonna skeemi jaoks. Kuna rahvahulgahangete platvormid maksavad inimtöötajatele ülesannete täitmise eest asjakohaselt, osalevad kasutajad suurema sissetuleku saavutamiseks sageli topelttegevustes. Näiteks saavad mitmed eri riikide kasutajad kasutada VPN -i andmete tuvastamise programmis osalemiseks, mis nõuab Ameerika elanike teatud vastuseid. See põhjustab madalamaid ja mõttetuid vastuseid, mis omakorda vähendab andmete kvaliteeti.
Kui on esitatud madala kvaliteediga andmed, tõstatab see tõsiseid küsimusi olemasoleva kvaliteeditagamise protsessi kohta. Kuna suurem osa olemasolevatest andmete tuvastamiseks on tugevalt tsentraliseeritud, on peaaegu võimatu kvaliteeti ja töövoogu hinnata. Kõik need probleemid, mis on koos plokiahelatehnoloogia komeedilaadse kasvuga, on sillutanud teed detsentraliseeritud ja heakskiiduvabade rahvahulgaharjutuste lahenduste jaoks.
Siin tutvustab inimese protokoll uut uut lähenemisviisi andmete märgistamisele, luues infrastruktuuri, mis toetab lubadeta tööturge, mis pakuvad ka inimtöötajatele tööd ja annab organisatsioonidele juurdepääsu töötajatele kõigile ilma keskseadmeteta.
Inimese protokoll on loomulikult detsentraliseeritud ja automatiseeritud avatud lähtekoodiga infrastruktuur, mis pakub hübriidraami inimtöö korraldamiseks, hindamiseks ja töötasuks. Inimese protokoll teenib nii töötajate kui ka tööandjate huve. Selle tulemusel saab seda kasutada erinevates rakendustes, sealhulgas rahvahulga allhanke- ja kontserdipõhistes projektides. Kuigi inimese protokoll on peaaegu üldiselt rakendatav, keskendub see kõigepealt detsentraliseeritud turuplatside toele seoses masinõppega (ML). Täpsemalt öeldes on inimese protokoll lihtsam salvestada tohutul hulgal kvaliteetseid inimkommentaariandmeid, säilitades samal ajal optimaalse teenindustaseme. Kui inimese protokoll kerkis algselt välja Hcaptchast, mis on Web 2.0 üks populaarseimaid ja testitud Captcha-teenuseid, on platvorm sellest ajast alates loonud end täiesti ainulaadse üksusena, pakkudes selle aluseks olevat tehnoloogiat, mis toetab kõikjaid turge, milles peaaegu iga ülesandega seotud andmete tuvastamine-rahvahulk-võimalikult palju. Inimeste tööturg pakub praegu video-, pildi- ja tekstiabi turge, kus ostjaid ja müüjaid kokku viiakse. Alusprotokoll võib jagada töö (ülesande) paljudele nendele turgudele ja saata selle vastavatele vahetustele (rakendused, mida töötajad töö tegemiseks kasutavad). Lisaks võib see kvaliteedi tagamiseks vastu võtta kõigi tööturgude andmeid. Lisaks on inimese protokollimeeskond valinud parimad saadaolevad tööriistad iga tööturu jaoks. Nad on välja töötanud vahetused ja optimeerivad neid pidevalt, et pakkuda töötajatele kõike, mida nad vajavad taotletud ülesannete täitmiseks. Protokoll sisaldab ka tööriistu, mis säilitavad edastatud tööde kvaliteedi kontrolli. See tähendab tõhusalt, et taotlused saavad deterministlikuma tulemuse, kui sarnaseid töökohti tehakse sama vahetusega. Lõppude lõpuks pakub inimese protokoll täiesti avatud lahendust võrreldes tugevalt tsentraliseeritud ja mikrojuhtidega platvormidega, mis võimaldab mitmesugustel projektidel kasutada selle infrastruktuuri. Lisaks pakub see ka võimalust aidata projektidel lisada oma tööriistad, et täita andmete märgistamise nõudeid täpsemalt, tõhusamalt ja ilma vahemüüjateta. Kõige olulisem on see, et töökohtade noteerimine, levitamine ja tasustamine on lisaks miljonitele mikromaksetele ka tänu protokolli blockchain-tehnoloogia rakendamisele, et hõlbustada tehinguid ja arveldust korrapärase, usaldusväärse ja õiglase viisi saamiseks.
heakskiiduvabade tööturgude hõlbustamine
Kommentare (0)