Klausimas ekspertui: Ar tiesa, kad socialiniai tinklai stebi mus
Dmitrijus Kurkinis
ATSAKYMAI DĖL JAV KLAUSIMŲ GALIMYBĖS mes ieškojome internete. Naujose medžiagų serijose mes užduodame tokius klausimus: deginimas, netikėtas ar plačiai paplitęs įvairių sričių specialistams.
Metų pradžioje socialiniuose tinkluose paleistas „10-metų iššūkis“ „flash“ mobilumas ne tik sukėlė sąmokslo teorijas, kad kampanijos tikslas buvo rinkti naudotojų nuotraukas ir mokyti juos atpažinti veido atpažinimo sistemą, bet ir vėl padėjo jiems galvoti apie tai, kiek jie žino apie mus. socialiniai tinklai ir su jais bendradarbiaujančios trečiosios šalys (nuo komercinių bendrovių iki vyriausybės agentūrų).
Tai, kad technologijų gigantai renka ir analizuoja vadinamuosius skaitmeninius pėdsakus, kuriuos palieka milijardai vartotojų kasdien, nėra niekam paslaptis. Ir tai suvokiant atsiranda naujos „didžiojo brolio“ baimės: socialiniai tinklai daug apie mus žino, bet kas, jei jie per daug žino apie mus? Ar gali būti naudojami dideli duomenys, kad sužinotumėte visus žmogaus ryšius, skonius, įpročius, praeitį ir dabartį? O jei taip, kokia žala gali būti mūsų noras bendrauti internete, dėl kurios mes savanoriškai dalijamės informacija apie save?
Mes paklausėme ekspertų apie tai, kaip didelės įmonės apdoroja naudotojo duomenis ir kaip didelis pavojus paveldėti socialiniuose tinkluose.
Liliya Zemnukhova
Peterburgo Europos universiteto Mokslo ir technologijų tyrimų centro mokslininkas
Skaitmeninis pėdsakas apima visus galimus duomenų tipus - tekstus, vaizdus, garso ir vaizdo įrašus, geografinę vietą ir daugybę metaduomenų (pvz., Įtaisų modelis, mobiliojo ryšio operatorius, operacinė sistema, dinamika ir apsilankymų trukmė ir tt). Ir tai ne tik mūsų skaitmeninis pėdsakas. Socialiniai tinklai suformuoja mus kaip naudotojus, naudodami tris duomenų šaltinius: tai, kad mes patys apie save pranešame; kad kiti praneša apie mus; ir kas vyksta dažniausiai be mūsų žinios. Ypač nepermatoma paskutinė. Paprastai mes neskaitome vartotojo sutarčių ir asmens duomenų rinkimo ir naudojimo politikos. Pastebime tik tai, kad ši „juodoji dėžė“ kažkaip įtakoja mūsų naudotojo patirtį: tikslinę reklamą, draugų pasiūlymus, rekomendacijas dėl muzikos, naujienų paleidimo tvarką ... Mes patys konstruojame nedidelę šios patirties dalį, kai rankiniu būdu kuriame naujienų kanalą, bet daugiausia algoritmus atlikite numatytųjų profilių įterptas funkcijas. Štai kodėl mes niekada neatsisakysime kontekstinės reklamos ar nepageidaujamų grupių ar (ne) draugų pasiūlymų. Socialiniai tinklai, kaip korporacijos, naudoja duomenis apie savo vartotojus komerciniais tikslais, siūlydami savo platformą parduoti tikslinį turinį. Be to, jie ir toliau kaupia duomenis apie mus: pavyzdžiui, jei bent vieną kartą sumokėjote už reklamą, banko duomenys ir sandorių duomenys taip pat lieka bendrovei. Duomenys taip pat gali būti teikiami vyriausybinėms agentūroms, kai yra didelis poreikis: pavyzdžiui, „Facebook“ reguliariai bendradarbiauja su JAV vyriausybinėmis agentūromis pagal savo skaidrumo politiką.
Be vidinių socialinių tinklų politikos, yra dar viena svarbi informacija: sąskaitos gali būti susietos su šimtais tūkstančių kitų programų ir funkcijų. Tai, pavyzdžiui, buvo didelių praėjusių metų diskusijų priežastis, susijusi su trečiųjų šalių prieiga prie naudotojų duomenų. Europos Sąjungoje buvo atliktas svarbus bandymas reguliuoti kūrėjų laisvę - praėjusiais metais įsigaliojo Bendrosios duomenų apsaugos taisyklės (GDPR). Jis nusprendė neperduoti duomenų problemų, tačiau atkreipė vartotojų dėmesį į šį klausimą. Tai nereiškia, kad mes privalome perskaityti visus naudotojų susitarimus, tačiau tai verčia mus galvoti ir bent jau būti atsakingesni už skaitmeninius pėdsakus ir laikytis pagrindinių skaitmeninės higienos taisyklių.
Valeria Karavaeva
„Spiking“ duomenų mokslininkas
Kartais nemanome, kiek takelių paliekame internete ir kiek vėliau ji padeda įmonėms, ne tik socialiniams tinklams, nors ir socialiniams tinklams. Socialiniai tinklai renka duomenis ne tik už save, jie gali juos parduoti - aš apie tai žinau, nes dirbau reklamos agentūroje, o mes nupirko duomenis iš „Facebook“. Ir dažniausiai mes, vartotojai, duodame sutikimą tai nepastebėdami. Žmonės pusę savo gyvenimo praleidžia socialiniuose tinkluose ir teikia daug informacijos apie save.
Tačiau buvo įmanoma rinkti duomenis anksčiau - kodėl jūs neseniai pradėjote kalbėti apie didelius duomenis? Pirmiausia, nes skaičiavimo galia auga ir atitinkamai tampa pigesnė. Pagrindinis didelių duomenų klausimas yra ne tai, kaip rinkti duomenis - iš esmės kiekvienas iš mūsų šiandien gali rinkti ir saugoti informacijos apie terabaitus, bet kaip dirbti su jais. Dauguma duomenų, gautų iš socialinių tinklų (teksto, balso, paveikslėlių, vaizdo įrašų), nėra jokiu būdu struktūrizuoti, todėl be mašinų mokymosi dideli duomenys yra nenaudingi. Dabar, dėl to, kad galia ir atmintis tapo pigesnės, padidėjo nervinių tinklų ir gilaus mokymosi poreikis - pagaliau išmokome apdoroti didelius duomenų masyvus.
Paimkite, pavyzdžiui, nuotraukas - ir tai yra tikrai dideli duomenys, jie gali suteikti daug informacijos. Yra milijonų nuotraukų, bet ką su jais daryti? Kokią naudą galima gauti iš jų? Kokių modelių jie jums praneš? Mašinų mokymasis iš tikrųjų nėra toks senas. Tai nėra toks paprastas procesas, kaip atrodo: nėra tokio dalyko, kurį paspaudžiate, o per savaitę gausite pilnus skaičiavimus.
Prieš pradedant mokytis kompiuteriu, atliekami sudėtingesni uždaviniai. Tos pačios nuotraukos pirmiausia turi būti tinkamai apdorotos (pavyzdžiui, apkarpytos, centruotos nuotraukos; tai svarbu mokymuisi) - tai pirmasis etapas, kuris paprastai trunka ilgai. Antrasis etapas - pasirinkti tinklo architektūrą, tinkamą problemai spręsti. Apytiksliai kalbant, jūs statote dešimt skirtingų neuronų tinklų, ir jie duoda dešimt skirtingų rezultatų. Tada jums reikia kažkaip įvertinti rezultatus. Ir po to jūs, su didele tikimybe, grįšite į pirmąjį etapą. Neįmanoma sukurti vieno universalaus tinklo bet kuriai užduočiai: jūs ją kuriate nuo nulio arba pakeisite esamą. Veido atpažinimas yra viena užduotis, o kačių pripažinimas yra kitas.
Mašininio mokymosi procese taip pat dalyvaujame, nežinodami. Pavyzdžiui, įvedus „captcha“ svetainėse: naudojant „captcha“, „Google“ apmokyti neuroninius tinklus knygų skaitmeninimui.
Turime suprasti, kad įmonės, kurios renka didelius duomenis, nėra suinteresuotos mūsų asmeniniais profiliais. Jiems reikia duomenų apie daugybę skirtingų žmonių, kurie domisi kažkuo konkrečiu. Kalbant apie specialias paslaugas, manau, kad jie gali rinkti duomenis nenaudodami socialinių tinklų. Manau, kad mūsų baimės, kad mes stebime, netrukus praeis. Tai yra naujas pasaulis: galima nepaveldėti žiniatinklio, bet tai sunku. Tai lengviau neatsirasti internete.
NUOTRAUKOS: antonsov85 - stock.adobe.com