Otázka pre experta: Je pravda, že nás sledujú sociálne siete

Dmitrij Kurkin

ODPOVEĎ NA VEĽKOSŤ OTÁZOK USA Použili sme na vyhľadávanie online. V novej sérii materiálov kladieme tieto otázky: pálenie, nečakané alebo rozšírené - pre odborníkov v rôznych oblastiach.

Flash 10 rokov Challenge, ktorý bol spustený v sociálnych sieťach na začiatku roka, nielenže splodil konšpiračné teórie, že cieľom kampane bolo zbierať fotografie používateľov a školiť ich, aby rozpoznali systém rozpoznávania tváre, ale tiež ich znovu premýšľali o tom, koľko o nás vie. sociálne siete a tretie strany, ktoré s nimi pracujú (od komerčných spoločností po vládne agentúry).

Skutočnosť, že technologickí giganti zbierajú a analyzujú tzv. Digitálne stopy, ktoré denne zanechávajú miliardy používateľov, nie je nikomu tajomstvom. A povedomie o tom vyvoláva nový druh strachu z „veľkého brata“: sociálne siete o nás veľa vedia, ale čo ak o nás vedia príliš veľa? Môžu byť veľké dáta použité na zistenie všetkých spojení, chutí, návykov človeka, jeho minulosti a súčasnosti? A ak áno, aká škoda môže mať naša túžba socializovať sa on-line, kvôli čomu nás dobrovoľne zdieľame informácie o sebe?

Pýtali sme sa expertov na to, ako veľké spoločnosti spracovávajú užívateľské údaje a aké veľké nebezpečenstvo je dedenie na sociálnych sieťach.

Liliya Zemnukhova

Výskumný pracovník v Centre pre výskum vedy a techniky na Európskej univerzite v Petrohrade

Digitálna stopa obsahuje všetky možné typy údajov - textov, obrázkov, zvukových a obrazových záznamov, geolokáciu a množstvo metaúdajov (napríklad model gadget, mobilný operátor, operačný systém, dynamiku a trvanie návštev atď.). A nie len my, ktorí dopĺňajú našu digitálnu stopu. Sociálne siete nás tvoria ako používateľov pomocou troch zdrojov údajov: skutočnosť, že my sami o sebe podávame správy; že iní o nás informujú; a čo sa deje najčastejšie bez nášho vedomia. Najmä nepriehľadné. Spravidla nečítame používateľské zmluvy a zásady zhromažďovania a používania osobných údajov. Berieme len na vedomie, že táto "čierna skrinka" nejakým spôsobom ovplyvňuje našu užívateľskú skúsenosť: cielenú reklamu, návrhy od priateľov, odporúčania pre hudbu, postup pre spúšťanie noviniek ... Samotnú konštrukciu malého zážitku konštruujeme sami, keď manuálne zostavujeme informačný kanál, ale hlavne algoritmy vykonávať funkcie vložené do predvolených profilov. Preto sa nikdy nezbavíme kontextovej reklamy alebo dotieravých návrhov skupín alebo (nie) priateľov. Sociálne siete ako korporácie využívajú údaje o svojich užívateľoch na komerčné účely a ponúkajú svoju platformu na predaj cieleného obsahu. A na ceste ďalej zhromažďujú údaje o nás: napríklad, ak ste zaplatili za reklamu aspoň raz, potom banková karta a údaje o transakciách zostávajú aj v spoločnosti. Údaje môžu byť poskytnuté aj vládnym agentúram, keď je veľká potreba: napríklad Facebook pravidelne spolupracuje s vládnymi agentúrami USA v súlade so svojou politikou transparentnosti.

Okrem vnútornej politiky sociálnych sietí existuje ešte jeden dôležitý detail: účty môžu byť spojené so stovkami tisíc ďalších aplikácií a funkcií. To bolo napríklad dôvodom veľkých diskusií o prístupe tretích strán k používateľským údajom v minulom roku. Významný pokus o reguláciu slobody vývojárov bol v Európskej únii - v minulom roku vstúpili do platnosti Všeobecné nariadenia o ochrane údajov (GDPR). Rozhodol sa neprenášať problémy s údajmi, ale upriamil pozornosť používateľov na túto otázku. Nezaväzuje nás k tomu, aby sme si prečítali všetky užívateľské dohody, ale myslíme a aspoň sme viac zodpovední za naše digitálne stopy a dodržiavame základné pravidlá digitálnej hygieny.

Valeria Karavaeva

data scientist v spoločnosti Spiking

Niekedy nemyslíme na to, koľko skladieb odchádzame na webe a koľko neskôr pomáha spoločnostiam, nielen sociálnym sieťam - hoci aj sociálnym sieťam. Sociálne siete zbierajú údaje nielen pre seba, môžu ich predávať - viem o tom, pretože som pracoval v reklamnej agentúre a nakupovali sme údaje z Facebooku. A najčastejšie my, používatelia, dávame na to súhlas bez toho, aby sme si to všimli. Ľudia trávia polovicu svojho života na sociálnych sieťach a poskytujú veľa informácií o sebe.

Doteraz bolo možné zbierať údaje - tak prečo ste začali hovoriť o veľkých údajoch len nedávno? Po prvé, pretože rastie výpočtový výkon, a preto sa stáva lacnejším. Hlavnou otázkou veľkých dát nie je ako zbierať dáta - v zásade každý z nás dnes môže zbierať a ukladať terabajty informácií - ale ako s nimi pracovať. Väčšina údajov získaných zo sociálnych sietí (text, hlas, obrázky, video) nie je štruktúrovaná žiadnym spôsobom, takže bez strojového učenia sú veľké údaje k ničomu. Teraz, vzhľadom k tomu, že energia a pamäť sa stali lacnejšími, sa zvýšil dopyt po neurónových sieťach a hlbokom vzdelávaní - konečne sme sa naučili spracovávať veľké súbory údajov.

Vezmite si napríklad obrázky - a to je naozaj veľké dáta, môžu dať veľa informácií. Existujú milióny obrázkov, ale čo s nimi robiť? Ako môžete z nich profitovať? Aké vzory vám dali vedieť? Strojové učenie v skutočnosti nie je až tak ďaleko. Nie je to tak jednoduchý proces, ako sa zdá: neexistuje žiadna taká vec, že by ste stlačili tlačidlo a za týždeň dostávali úplné výpočty.

Priamemu strojovému učeniu predchádza zložitejšie úlohy. Tie isté obrázky musia byť najprv správne spracované (napríklad orezané, centrované fotografie, čo je dôležité pre učenie) - toto je prvá etapa, ktorá zvyčajne trvá dlho. Druhou fázou je zvoliť sieťovú architektúru vhodnú na riešenie problému. Zhruba povedané, postavíte desať rôznych neurónových sietí a poskytnú desať rôznych výsledkov. Potom musíte nejako vyhodnotiť výsledky. A potom sa s vysokou pravdepodobnosťou vrátite do prvej etapy. Nie je možné vybudovať jednu univerzálnu sieť pre akúkoľvek úlohu: buď ju vytvoríte od nuly, alebo ju upravíte. Rozpoznanie tváre je jednou z úloh, uznanie mačiek je ďalšou úlohou.

V procese strojového učenia sa zúčastňujeme aj bez toho, aby sme to vedeli. Napríklad, zavedenie captcha na stránkach: pomocou captcha, Google vyškolil neurónové siete na digitalizáciu kníh.

Musíme pochopiť, že spoločnosti, ktoré zbierajú veľké údaje, nemajú záujem o naše osobné profily. Potrebujú údaje o mnohých rôznych ľuďoch, ktorí sa zaujímajú o niečo konkrétne. Pokiaľ ide o špeciálne služby, myslím si, že môžu zbierať údaje bez toho, aby sa uchýlili k sociálnym sieťam. Myslím si, že naše obavy, že sme sledovaní, čoskoro prejdú. Toto je nový svet: nie je možné sledovať web, ale je to ťažké. Je jednoduchšie sa vôbec nezobrazovať na webe.

FOTO: antonsov85 - stock.adobe.com