Sapa sing ngumpulake data gedhe lan kenapa?

Ing musim gugur 2019, skandal njeblug karo layanan Apple Card: nalika ndhaptar, ngetokake watesan kredit sing beda kanggo pria lan wanita. Malah Steve Wozniak ora beruntung:

Setaun sadurunge, dicethakake yen platform Netflix nuduhake pangguna poster lan teaser sing beda-beda, gumantung saka jender, umur lan kewarganegaraan. Kanggo iki, layanan kasebut dituduh rasisme.

Akhire, Mark Zuckerberg ajeg ditegur amarga diduga ngumpulake, adol lan manipulasi data pangguna dening Facebook. Sajrone pirang-pirang taun, dheweke dituduh lan malah nyoba kanggo manipulasi sajrone pemilihan Amerika, nulungi layanan khusus Rusia, nyebabake gething lan pandangan radikal, pariwara sing ora cocog, bocor data pangguna, ngalangi investigasi marang pedofil.

Kiriman Facebook dening zuck

Ing wektu sing padha, layanan online Pornhub saben taun nerbitake laporan babagan jinis porno sing digoleki saka macem-macem negara, jender lan umur. Lan sakperangan alesan iki ora ngganggu sapa wae. Senajan kabeh crita iki padha: ing saben wong kita dealing with data amba, kang ing abad kaping XNUMX disebut "lenga anyar".

Apa data gedhe

Data gedhe - uga data gedhe (eng. Big Data) utawa metadata - minangka susunan data sing teka kanthi rutin lan kanthi volume gedhe. Dikumpulake, diproses lan dianalisis, ngasilake model lan pola sing jelas.

Conto sing nyenengake yaiku data saka Large Hadron Collider, sing terus-terusan lan akeh. Kanthi bantuan, para ilmuwan ngrampungake akeh masalah.

Nanging data gedhe ing web ora mung statistik kanggo riset ilmiah. Iki bisa digunakake kanggo nglacak kepiye pangguna saka macem-macem klompok lan warga negara tumindak, apa sing digatekake lan kepiye sesambungan karo konten. Kadhangkala, kanggo iki, data dikumpulake ora saka siji sumber, nanging saka sawetara, mbandhingake lan ngenali pola tartamtu.

Babagan carane penting data amba ing jaringan, padha miwiti ngomong nalika ana tenan akeh. Ing wiwitan taun 2020, ana 4,5 milyar pangguna Internet ing saindenging jagad, sing 3,8 milyar didaftar ing jaringan sosial.

Sing duwe akses menyang Big Data

Miturut survey, luwih saka setengah negara kita percaya yen data ing jaringan kasebut digunakake dening pihak katelu. Ing wektu sing padha, akeh sing ngirim informasi pribadhi, foto, lan malah nomer telpon ing jaringan sosial lan aplikasi.

Sapa sing ngumpulake data gedhe lan kenapa?
Sapa sing ngumpulake data gedhe lan kenapa?
Sapa sing ngumpulake data gedhe lan kenapa?
Sapa sing ngumpulake data gedhe lan kenapa?

Perlu diterangake ing kene: wong pisanan yaiku pangguna dhewe, sing nempatake data ing sumber utawa aplikasi apa wae. Ing wektu sing padha, dheweke setuju (nglebokake tandha ing persetujuan) kanggo ngolah data kasebut pihak liya - yaiku, sing nduweni sumber daya. Pihak katelu yaiku wong sing nduweni sumber daya bisa nransfer utawa ngedol data pangguna. Asring iki ditulis ing persetujuan pangguna, nanging ora mesthi.

Pihak katelu yaiku lembaga pemerintah, peretas utawa perusahaan sing tuku data kanggo tujuan komersial. Tilas bisa entuk data kanthi keputusan pengadilan utawa panguwasa sing luwih dhuwur. Peretas, mesthi, ora nggunakake ijin apa wae - dheweke mung hack database sing disimpen ing server. Perusahaan (miturut hukum) mung bisa ngakses data yen sampeyan dhewe wis ngidini - kanthi mriksa kothak ing persetujuan kasebut. Yen ora, iku ilegal.

Napa perusahaan nggunakake Big Data?

Data gedhe ing lapangan komersial wis digunakake pirang-pirang dekade, mung ora kaya saiki. Iki, contone, cathetan saka kamera ndjogo, data saka navigator GPS utawa pembayaran online. Saiki, kanthi pangembangan jaringan sosial, layanan lan aplikasi online, kabeh iki bisa disambungake lan entuk gambaran sing paling lengkap: ing ngendi para pelanggan potensial manggon, apa sing seneng ditonton, ing ngendi dheweke liburan lan apa merek mobil sing diduweni.

Saka conto ing ndhuwur, jelas yen kanthi bantuan data gedhe, perusahaan, pisanan, pengin ngarahake iklan. Yaiku, kanggo nawakake produk, layanan utawa pilihan individu mung kanggo pamirsa sing tepat lan malah ngatur produk kanggo pangguna tartamtu. Kajaba iku, pariwara ing Facebook lan platform gedhe liyane dadi luwih larang, lan nuduhake menyang kabeh wong sing berturut-turut ora duwe bathi.

Informasi babagan pelanggan potensial saka sumber terbuka digunakake kanthi aktif dening perusahaan asuransi, klinik swasta lan pengusaha. Tilas, contone, bisa ngganti syarat-syarat insurance yen padha weruh sing asring looking for informasi babagan penyakit utawa obat-obatan tartamtu, lan juragan bisa netepke apa sampeyan rentan kanggo konflik lan prilaku antisosial.

Nanging ana tugas penting liyane sing wis berjuang ing taun-taun pungkasan: kanggo nyedhaki pamirsa sing paling solvent. Iki ora supaya gampang kanggo nindakake, sanajan tugas Ngartekno difasilitasi dening layanan pembayaran lan kir elektronik liwat siji OFD (operator data fiskal). Supaya bisa nyedhaki, perusahaan malah nyoba nglacak lan "nguri-uri" pelanggan potensial wiwit cilik.: liwat game online, Toys interaktif lan layanan pendidikan.

Carane ora iku bisa?

Kesempatan paling gedhe kanggo koleksi data yaiku saka perusahaan global sing duwe sawetara layanan sekaligus. Facebook saiki duwe luwih saka 2,5 milyar pangguna aktif. Ing wektu sing padha, perusahaan uga duwe layanan liyane: Instagram - luwih saka 1 milyar, WhatsApp - luwih saka 2 milyar lan liya-liyane.

Nanging Google duwe pengaruh luwih akeh: Gmail digunakake dening 1,5 milyar wong ing donya, 2,5 milyar liyane dening OS seluler Android, luwih saka 2 milyar dening YouTube. Lan iki ora kalebu telusuran Google lan aplikasi Google Maps, toko Google Play, lan browser Chrome. Iku tetep kanggo nyepetake bank online sampeyan - lan Google bakal bisa ngerti kabeh babagan sampeyan. Miturut cara, Yandex wis dadi langkah maju ing babagan iki, nanging mung kalebu pamirsa sing nganggo basa Rusia.



???? Kaping pisanan, perusahaan kasengsem karo apa sing dikirim lan disenengi ing jaringan sosial. Contone, yen bank weruh yen sampeyan wis nikah lan aktif seneng karo bocah-bocah wadon ing Instagram utawa Tinder, sampeyan luwih seneng nyetujoni utangan konsumen. Lan hipotek ing kulawarga wis ilang.

Penting uga iklan apa sing sampeyan klik, sepira kerepe lan apa asile.

(Ya Langkah sabanjure yaiku pesen pribadi: ngemot informasi luwih akeh. Pesen bocor ing VKontakte, Facebook, WhatsApp lan pesen cepet liyane. Miturut wong-wong mau, kanthi cara, gampang kanggo nglacak geolokasi nalika ngirim pesen. Mesthi sampeyan wis ngeweruhi: nalika sampeyan ngrembug babagan tuku utawa mung pesen pizza karo wong, iklan sing cocog langsung katon ing feed.

🚕 Data gedhe digunakake kanthi aktif lan "bocor" dening layanan pangiriman lan taksi. Dheweke ngerti ngendi sampeyan manggon lan kerja, apa sing sampeyan tresnani, apa kira-kira penghasilan sampeyan. Uber, contone, nuduhake rega sing luwih dhuwur yen sampeyan nyopir mulih saka bar lan temenan overdone. Lan yen sampeyan duwe akeh aggregator liyane ing telpon, sebaliknya, dheweke bakal menehi sing luwih murah.

(Ya Ana layanan sing nggunakake foto lan video kanggo ngumpulake informasi sabisa. Contone, perpustakaan visi komputer - Google duwe. Dheweke mindai sampeyan lan saubengé kanggo ndeleng ukuran utawa dhuwur sampeyan, merek apa sing sampeyan gunakake, mobil apa sing sampeyan drive, apa sampeyan duwe bocah utawa kewan.

(Ya Sing nyedhiyakake gateway SMS menyang bank kanggo layang bisa nglacak tumbas ing kertu kasebut - ngerti pungkasan 4 digit lan nomer telpon - lan banjur ngedol data iki kanggo wong liya. Mula kabeh spam iki kanthi diskon lan pizza minangka hadiah.

🤷️️ Pungkasan, awake dhewe bocor data menyang layanan lan aplikasi sisih kiwa. Elinga yen hype ing sekitar Getcontact, nalika kabeh wong seneng ngisi nomer telpon kanggo mangerteni carane ditulis dening wong liya. Lan saiki golek persetujuan lan waca apa sing diomongake babagan transfer data sampeyan (spoiler: sing nduweni bisa nransfer menyang pihak katelu miturut kawicaksanane):

Sapa sing ngumpulake data gedhe lan kenapa?

Korporasi bisa sukses ngumpulake lan malah ngedol data pangguna nganti pirang-pirang taun, nganti ana tuntutan hukum - kaya sing kedadeyan karo Facebook sing padha. Lan banjur peran sing nemtokake dimainake dening perusahaan nglanggar GDPR - hukum ing EU sing mbatesi panggunaan data luwih ketat tinimbang Amerika. Conto anyar liyane yaiku skandal antivirus Avast: salah sawijining layanan anak perusahaan ngumpulake lan adol data saka 100 nganti 400 yuta pangguna.

Nanging apa kabeh iki duwe kaluwihan kanggo kita?

Kepiye data gedhe mbantu kita kabeh?

Ya, ana sisih padhang uga.

Data gedhe mbantu nyekel penjahat lan nyegah serangan teroris, nemokake bocah sing ilang lan nglindhungi saka bebaya.

Kanthi bantuan, kita kita nampa tawaran kelangan saka bank lan diskon pribadi. Thanks kanggo wong-wong mau kita ora mbayar akeh layanan lan jaringan sosial sing entuk mung ing iklan. Yen ora, Instagram mung bakal biaya sawetara ewu dolar saben wulan.

Facebook mung duwe 2,4 milyar pangguna aktif. Ing wektu sing padha, bathi kanggo 2019 gunggunge $18,5 milyar. Pranyata perusahaan entuk nganti $ 7,7 saben taun saka saben pangguna liwat iklan.

Pungkasan, kadhangkala mung trep: nalika layanan wis ngerti sampeyan lagi ing ngendi lan apa sing dikarepake, lan sampeyan ora kudu golek informasi sing dibutuhake dhewe.

Wilayah liyane sing dijanjekake kanggo aplikasi Big Data yaiku pendidikan.

Ing salah sawijining universitas Amerika ing Virginia, panaliten ditindakake kanggo ngumpulake data siswa saka klompok risiko sing diarani. Iki wong sing sinau kurang, bolos kelas lan arep metu. Kasunyatane yaiku ing negara-negara saben taun kira-kira 400 wong dikurangi. Iki ora becik kanggo universitas, sing ratinge diturunake lan dana dipotong, lan kanggo para siswa dhewe: akeh sing njupuk silihan kanggo pendhidhikan, sing sawise dikurangi, isih kudu dibayar maneh. Ora kanggo sebutno wektu ilang lan prospek karir. Kanthi bantuan saka data amba, iku bisa kanggo ngenali lagging konco ing wektu lan kurban wong tutor, kelas tambahan lan bantuan diangkah liyane.

Iki, kanthi cara, uga cocok kanggo sekolah: banjur sistem bakal menehi kabar marang guru lan wong tuwa - padha ngomong, bocah kasebut duwe masalah, ayo padha nulungi dheweke. Big Data uga bakal mbantu sampeyan ngerti buku teks sing luwih apik lan guru sing luwih gampang nerangake materi kasebut.

Conto positif liyane yaiku profil karir.: Iki nalika remaja dibantu kanggo mutusake profesi ing mangsa ngarep. Ing kene, data gedhe ngidini sampeyan ngumpulake informasi sing ora bisa dipikolehi kanthi nggunakake tes tradisional: kepiye pangguna tumindak, apa sing digatekake, kepiye interaksi karo konten kasebut.

Ing AS sing padha, ana program bimbingan karir - SC ACCELERATE. Iki, ing antarane, nggunakake teknologi GPS CareerChoice: nganalisa data babagan sifat siswa, karep kanggo subjek, kekuwatan lan kelemahane. Data kasebut banjur digunakake kanggo mbantu para remaja milih perguruan tinggi sing cocog kanggo dheweke.


Langganan lan tindakake kita ing Yandex.Zen — teknologi, inovasi, ekonomi, pendidikan lan nuduhake ing siji saluran.

Ninggalake a Reply