Cilvēka protokols no jauna definē datu marķēšanas un kopuzņēmumu tirgu, lai panāktu labāku precizitāti
Cilvēka protokols no jauna definē datu marķēšanas un kopuzņēmumu tirgu, lai panāktu labāku precizitāti
Mākslīgais intelekts (AI) savu mērķi var izpildīt tikai tad, ja tas ir apmācīts ar augstas kvalitātes datiem. AI algoritma panākumi lielā mērā ir atkarīgi no izmantoto apmācības datu kvalitātes un kvantitātes. Attiecīgi tam nevajadzētu pārsteigt AI projekta izveidošana ir veltīta apmācības datu optimizēšanai
Lielākā daļa AI projektu saskaras ar sarežģīto uzdevumu vākt vai iegādāties augstas kvalitātes datus. Ir vairāki gadījumi, kad projekti bieži beidzas ar zemas kvalitātes datiem vai marķētiem datiem. Kaut arī pēdējos gados ir izveidoti vairāki datu identifikācijas pakalpojumi, kas zināmā mērā saskaras ar izaicinājumu, viņiem ir savas problēmas. Galvenie zemas kvalitātes datu iemesli ir, piemēram, cilvēki, procesi vai tehnoloģijas, ko izmanto marķēšanai.
Bet kas īsti ir marķēti dati?
Datu marķējums: AI modeļu degviela
Saistībā ar AI, marķēti dati attiecas uz datiem, kas ir "atzīmēti vai komentēti", lai mašīnas apguves modelis varētu paredzēt vēlamo rezultātu. Kopumā viss datu identifikācijas process parasti ietver vairākas darbības, piemēram, datu komentāri, klasifikācija, marķēšana, mērenība un apstrāde.
Datu marķēšanai ir vairākas pieejas, kuras var izmantot neatkarīgi viens no otra vai kombinācijā. Tas ietver iekšējo datu marķēšanu, ārpakalpojumus, kopšanas līdzekļu veidošanu un mašīnu izmantošanu (saskaņā ar kuru dati tiek marķēti, izmantojot mašīnmācīšanās algoritmus).
Atkarībā no problēmas sarežģītības, AI projekti bieži izmanto plašus marķēšanas procesus, lai pārveidotu, kas nav marķētus datus apmācības datos, kas jums jāiemāca saviem AI modeļiem, kurus var identificēt, lai izveidotu vēlamo izdevumu.
No daudzajām pieejamajām metodēm ir kopīga pieskaņa, kurā trešo personu platformu izmanto, lai vienlaikus piekļūtu lieliem cilvēku darbiniekiem, kas ir viena no visbiežāk izmantotajām projektu taktikām, lai identificētu datus. Pēdējos gados cita starpā, cita starpā, ir parādījušās vairākas platformas, piemēram, Amazon Mturk, Appen Meeta Dash, etiķešu lodziņš un Tagog, kā dažas no daudzsološākajām platformām, kas paredzētas cilvēku darbiniekiem datu marķēšanai.
Tomēr vairāki projekti ir pauduši bažas par kopuzņēmumu platformu datu kvalitāti. Piemēram, ņemiet vērā datu kvalitātes problēmu ar Amazon Mechanical Turk (Mturk), kas atgriežas 2018. gadā. Daudziem datu pētniekiem ir aizdomas, ka dati, kas izmanto robotus papildus pusei un pilnībā automātiskam kodu vai skriptiem, tika identificēti, lai ātri atbalstītu cilvēkus reakcijā uz noteiktām datu kopām.
Daļa no problēmas tika attiecināta uz lietotājiem no dažādām vietām, kurās izmantoja VPN, lai piedalītos aptaujās un anketās, kas nebija piemērotas to apgabala shēmai. Tā kā platformas, kas saistītas ar to, ka platformas maksā darbiniekiem atbilstoši par uzdevumu izpildi, lietotāji bieži piedalās divkāršās aktivitātēs, lai sasniegtu vairāk ienākumu. Piemēram, vairāki lietotāji no dažādām valstīm var izmantot VPN, lai piedalītos datu identifikācijas programmā, kurai ir vajadzīgas noteiktas atbildes no Amerikas iedzīvotājiem. Tas noved pie zemākas un muļķīgas atbildes, kas savukārt pazemina datu kvalitāti.
Ja tiek iesniegti zemas kvalitātes dati, tas rada nopietnus jautājumus par esošo kvalitātes nodrošināšanas procesu. Tā kā lielākā daļa esošo kopuzņēmumu platformu datu identificēšanai ir ļoti centralizēta, ir gandrīz neiespējami novērtēt kvalitāti un darbplūsmu. Visas šīs problēmas, kas saistītas ar kometai līdzīgo blokķēdes tehnoloģijas pieaugumu, ir pavērušas ceļu uz decentralizētiem un bez apstiprināšanas kopšanas risinājumiem.
Šeit cilvēka protokols piedāvā jaunu jaunu pieeju datu marķēšanai, izveidojot infrastruktūru, kas atbalsta bez atļauju darba tirgus, kas arī nodrošina cilvēku darbiniekiem darbu un nodrošina organizācijām piekļuvi darbiniekiem visiem bez centrālajiem starpniekiem.
Cilvēka protokols, protams, ir decentralizēta un automatizēta atvērtā pirmkoda infrastruktūra, kas piedāvā hibrīdu rāmi cilvēku darba organizēšanai, novērtēšanai un atalgošanai. Cilvēka protokols kalpo gan darbinieku, gan darba devēju interesēm. Rezultātā to var izmantot dažādās lietojumprogrammās, ieskaitot kopšanas līdzekļus un uz GIG balstītus projektus. Lai arī cilvēka protokols ir gandrīz vispārēji piemērojams, tas vispirms koncentrējas uz decentralizētu tirgus vietu atbalstu saistībā ar mašīnmācību (ML). Precīzāk sakot, cilvēka protokols ļauj vieglāk reģistrēt milzīgu daudzumu augstas kvalitātes cilvēku komentāru datus, vienlaikus saglabājot optimālu pakalpojumu līmeni. Kamēr cilvēka protokols sākotnēji parādījās no Hcaptcha, kas ir viens no vispopulārākajiem un pārbaudītajiem Captcha pakalpojumiem Web 2.0, platforma kopš tā laika ir izveidojusi sevi kā pilnīgi unikālu vienību, piedāvājot pamatā esošo tehnoloģiju, lai atbalstītu vispusīgus tirgus, kuros gandrīz katrs uzdevums, kas iekļauj datu identificēšanu-ko rada iespējami. Cilvēku darba tirgus šobrīd piedāvā video, attēlu un teksta palīdzības tirgus, uz kuriem tiek apvienoti pircēji un pārdevēji. Pamata protokols var sadalīt darbu (uzdevumu) daudzos no šiem tirgiem un nosūtīt to attiecīgajām biržām (lietojumprogrammas, kuras darbinieki izmanto, lai veiktu darbu). Turklāt tas var neitralizēt datus par visiem darba tirgiem, lai nodrošinātu kvalitāti. Turklāt cilvēka protokola komanda ir izvēlējusies labākos pieejamos rīkus katram darba tirgum. Viņi ir izstrādājuši apmaiņu un nepārtraukti optimizējuši tos, lai piedāvātu darbiniekiem visu nepieciešamo, lai pabeigtu pieprasītos uzdevumus. Protokolā ir arī rīki, kas uztur visaptverošu kvalitātes kontroli pār pārsūtītajiem darbiem. Tas efektīvi nozīmē, ka pieprasījumi saņem deterministiskāku rezultātu, ja tiek veikti līdzīgi darbi par to pašu apmaiņu. Galu galā cilvēka protokols piedāvā pilnīgi atvērtu risinājumu, salīdzinot ar stingri centralizētām un mikro pārvaldītām platformām, kas dažādiem projektiem ļauj izmantot tās infrastruktūru. Turklāt tas piedāvā arī iespēju palīdzēt projektiem pievienot savus rīkus, lai izpildītu prasības datu marķēšanai precīzāk, efektīvāk un bez starpposma tirgotājiem. Vissvarīgākais ir tas, ka darba vietu iekļaušana, izplatīšana un atalgojums tiek automatizēts papildus miljoniem mikro-maksājumiem, pateicoties protokola blockchain tehnoloģijas pielietošanai, lai atvieglotu darījumus un rēķinus par sakārtotu, uzticamu un taisnīgu ceļu.
darba tirgu bez apstiprināšanas atvieglošana
Kommentare (0)