빅데이터는 누가, 왜 수집하는가?

2019년 가을, Apple 카드 서비스에서 스캔들이 터졌습니다. 등록할 때 남성과 여성에 대해 서로 다른 신용 한도를 발행했습니다. Steve Wozniak조차도 운이 없었습니다.

XNUMX년 전, 넷플릭스 플랫폼은 사용자의 성별, 나이, 국적에 따라 다른 포스터와 티저를 보여준다는 사실이 밝혀졌다. 이를 위해 서비스는 인종 차별로 기소되었습니다.

마지막으로 Mark Zuckerberg는 Facebook에서 사용자 데이터를 수집, 판매 및 조작한 혐의로 정기적으로 견책을 받습니다. 수년 동안 그는 러시아 특별 서비스를 지원하고 증오와 급진적 견해를 선동하고 부적절한 광고, 사용자 데이터 유출, 소아 성애 자에 대한 조사를 방해하는 미국 선거 기간 동안 조작 혐의로 기소되고 심지어 시도되었습니다.

Zuck의 Facebook 게시물

동시에 Pornhub 온라인 서비스는 국적, 성별 및 연령이 다른 포르노 사람들이 어떤 종류의 포르노를 찾고 있는지에 대한 보고서를 매년 게시합니다. 그리고 어떤 이유로 이것은 아무도 귀찮게하지 않습니다. 이 모든 이야기는 비슷하지만 각각에서 우리는 XNUMX 세기에 "새로운 석유"라고 불리는 빅 데이터를 다루고 있습니다.

빅데이터란?

빅 데이터 - 빅 데이터(eng. Big Data) 또는 메타데이터이기도 함 - 정기적으로 대량으로 도착하는 데이터의 배열입니다. 수집, 처리 및 분석되어 명확한 모델과 패턴이 생성됩니다.

눈에 띄는 예는 지속적으로 대량으로 들어오는 Large Hadron Collider의 데이터입니다. 그들의 도움으로 과학자들은 많은 문제를 해결합니다.

그러나 웹상의 빅데이터는 과학적 연구를 위한 통계만이 아닙니다. 다양한 그룹 및 국적의 사용자가 어떻게 행동하는지, 무엇에 주의를 기울이고 콘텐츠와 상호 작용하는지 추적하는 데 사용할 수 있습니다. 이를 위해 때로는 하나의 소스가 아닌 여러 소스에서 데이터를 수집하여 특정 패턴을 비교하고 식별합니다.

빅 데이터가 네트워크에서 얼마나 중요한지에 대해 그들은 빅 데이터가 정말 많았을 때 이야기하기 시작했습니다. 2020년 초 전 세계 인터넷 사용자는 4,5억 명이었고 이 중 3,8억 명이 소셜 네트워크에 등록되었습니다.

빅 데이터에 접근할 수 있는 사람

설문 조사에 따르면 우리나라의 절반 이상이 네트워크의 데이터를 제XNUMX자가 사용한다고 생각합니다. 동시에 많은 사람들이 개인 정보, 사진, 심지어 전화번호까지 소셜 네트워크 및 애플리케이션에 게시합니다.

빅데이터는 누가, 왜 수집하는가?
빅데이터는 누가, 왜 수집하는가?
빅데이터는 누가, 왜 수집하는가?
빅데이터는 누가, 왜 수집하는가?

여기에 설명이 필요합니다. 첫 번째 사람은 사용자 자신입니다, 모든 리소스 또는 애플리케이션에 데이터를 배치합니다. 동시에 그는 이 데이터의 처리에 동의합니다(동의서에 체크 표시). 제XNUMX자 – 즉, 리소스 소유자. 제XNUMX자는 리소스 소유자가 사용자 데이터를 양도하거나 판매할 수 있는 대상입니다.. 종종 이것은 사용자 계약에 기록되지만 항상 그런 것은 아닙니다.

제XNUMX자는 상업적 목적으로 데이터를 구매하는 정부 기관, 해커 또는 회사입니다. 전자는 법원이나 상위 기관의 결정에 따라 데이터를 얻을 수 있습니다. 물론 해커는 권한을 사용하지 않습니다. 단순히 서버에 저장된 데이터베이스를 해킹합니다. 회사(법률에 따라)는 귀하가 허용한 경우에만 데이터에 액세스할 수 있습니다. 동의 아래의 확인란을 선택하면 됩니다. 그렇지 않으면 불법입니다.

기업은 왜 빅데이터를 사용할까요?

상업 분야의 빅 데이터는 수십 년 동안 사용되어 왔지만 지금처럼 강렬하지 않았습니다. 예를 들어 감시 카메라의 기록, GPS 내비게이터의 데이터 또는 온라인 결제가 있습니다. 이제 소셜 네트워크, 온라인 서비스 및 애플리케이션의 개발로 이 모든 것이 연결되어 가장 완벽한 그림을 얻을 수 있습니다. 잠재 고객이 사는 곳, 보고 싶어하는 것, 휴가를 가는 곳, 가지고 있는 자동차 브랜드 등.

위의 예에서 기업은 빅 데이터의 도움으로 우선 광고를 타겟팅하기를 원한다는 것이 분명합니다. 즉, 적절한 청중에게만 제품, 서비스 또는 개별 옵션을 제공하고 특정 사용자를 위해 제품을 맞춤화하는 것입니다. 또한 Facebook 및 기타 대형 플랫폼의 광고는 점점 더 비싸지고 있으며 모든 사람에게 연속으로 표시하는 것은 전혀 수익성이 없습니다.

오픈 소스의 잠재 고객에 대한 정보는 보험 회사, 개인 클리닉 및 고용주가 적극적으로 사용합니다. 예를 들어 전자는 당신이 특정 질병이나 약에 대한 정보를 자주 찾는 것을 보면 보험 조건을 변경할 수 있고 고용주는 당신이 갈등과 반사회적 행동을 하는 경향이 있는지 평가할 수 있습니다.

그러나 최근 몇 년 동안 고군분투하고 있는 또 다른 중요한 과제가 있습니다. 단일 OFD(재정 데이터 운영자)를 통한 지불 서비스 및 전자 수표로 작업이 크게 촉진되지만 이는 그렇게 쉬운 일이 아닙니다. 가능한 한 가까워지기 위해 회사는 어린 시절부터 잠재 고객을 추적하고 "육성"하려고 노력합니다.: 온라인 게임, 인터랙티브 장난감 및 교육 서비스를 통해.

어떻게 진행합니까?

데이터 수집의 가장 큰 기회는 한 번에 여러 서비스를 소유한 글로벌 기업입니다. Facebook은 현재 2,5억 명 이상의 활성 사용자를 보유하고 있습니다. 동시에 이 회사는 Instagram(1억 개 이상), WhatsApp(2억 개 이상) 등 다른 서비스도 소유하고 있습니다.

그러나 Google은 훨씬 더 큰 영향력을 가지고 있습니다. Gmail은 전 세계 1,5억 명, Android 모바일 OS에서 2,5억 명, YouTube에서 2억 명 이상이 사용합니다. Google 검색 및 Google 지도 앱, Google Play 스토어, Chrome 브라우저는 포함되지 않습니다. 온라인 은행을 고정하는 것이 남아 있으며 Google은 문자 그대로 귀하에 대한 모든 것을 알 수 있습니다. 그건 그렇고, Yandex는 이와 관련하여 이미 한 발 앞서 있지만 러시아어를 사용하는 청중만을 대상으로 합니다.



???? 우선 기업은 우리가 소셜 네트워크에 게시하고 좋아하는 것에 관심이 있습니다. 예를 들어 은행에서 당신이 기혼이고 인스타그램이나 틴더에서 적극적으로 여자를 좋아하고 있다는 것을 알게 되면 소비자 대출을 승인할 가능성이 높아집니다. 그리고 가족에 대한 모기지가 사라졌습니다.

어떤 광고를 클릭하는지, 얼마나 자주, 어떤 결과를 가져오는지도 중요합니다.

(즉 다음 단계는 비공개 메시지입니다. 여기에는 훨씬 더 많은 정보가 포함되어 있습니다. VKontakte, Facebook, WhatsApp 및 기타 인스턴트 메신저에서 메시지가 유출되었습니다. 그런데 그들에 따르면 메시지를 보낼 때 지리적 위치를 추적하는 것이 쉽습니다. 분명히 알아차리셨을 것입니다. 누군가와 무언가를 구입하거나 피자를 주문하는 것에 대해 논의할 때 관련 광고가 즉시 피드에 나타납니다.

🚕 빅데이터는 배달과 택시 서비스에서 활발히 활용되고 '유출'되고 있다. 그들은 당신이 사는 곳과 일하는 곳, 좋아하는 것이 무엇인지, 대략적인 수입이 얼마인지 알고 있습니다. 예를 들어, Uber는 바에서 집으로 운전하고 명백하게 과음하는 경우 더 높은 가격을 표시합니다. 그리고 휴대 전화에 다른 수집기가 많이 있으면 반대로 더 저렴한 것을 제공합니다.

(즉 사진과 동영상을 활용해 최대한 많은 정보를 수집하는 서비스가 있습니다. 예를 들어 컴퓨터 비전 라이브러리는 Google에 있습니다. 그들은 귀하와 귀하의 주변 환경을 스캔하여 귀하의 키나 키, 착용 브랜드, 운전하는 차, 자녀 또는 애완 동물이 있는지 여부를 확인합니다.

(즉 우편물을 위해 은행에 SMS 게이트웨이를 제공하는 사람들은 카드에서 구매 내역을 추적할 수 있습니다. – 마지막 4자리 숫자와 전화번호를 알고 – 그리고 이 데이터를 다른 사람에게 판매합니다. 따라서 이 모든 스팸은 할인과 피자를 선물로 제공합니다.

🤷️️ 마지막으로 우리는 왼쪽 서비스와 응용 프로그램에 데이터를 유출합니다. 모두가 기꺼이 자신의 전화번호를 입력하여 다른 사람이 어떻게 작성했는지 알아보려고 했던 Getcontact 주변의 과대 선전을 기억하십시오. 이제 계약을 찾아 데이터 전송에 대한 내용을 읽으십시오(스포일러: 소유자는 재량에 따라 데이터를 제XNUMX자에게 전송할 수 있음).

빅데이터는 누가, 왜 수집하는가?

기업은 동일한 Facebook에서 발생한 것처럼 소송이 제기될 때까지 수년간 사용자 데이터를 성공적으로 수집하고 판매할 수 있습니다. 그리고 결정적인 역할은 미국보다 훨씬 더 엄격하게 데이터 사용을 제한하는 EU의 법률인 GDPR을 회사가 위반한 것입니다. 또 다른 최근 사례는 Avast 바이러스 백신 스캔들입니다. 이 회사의 자회사 서비스 중 하나는 100억에서 400억 명의 사용자로부터 데이터를 수집하고 판매했습니다.

그러나이 모든 것이 우리에게 어떤 이점이 있습니까?

빅 데이터가 우리 모두에게 얼마나 도움이 됩니까?

네, 밝은 면도 있습니다.

빅데이터는 범죄자 검거 및 테러 예방, 실종아동 찾기 및 위험으로부터 보호하는 데 도움이 됩니다.

그들의 도움으로 우리는 우리는 은행 및 개인 할인으로부터 멋진 제안을 받습니다.. 그들 덕분에 우리는 우리는 광고로만 수익을 올리는 많은 서비스와 소셜 네트워크에 대해 비용을 지불하지 않습니다.. 그렇지 않으면 Instagram만으로도 한 달에 수천 달러의 비용이 듭니다.

페이스북만 해도 2,4억 명의 활성 사용자가 있습니다. 동시에 2019년 수익은 18,5억 달러에 달했습니다. 회사는 광고를 통해 각 사용자로부터 연간 최대 7,7달러를 벌어들이는 것으로 나타났습니다.

마지막으로 때로는 편리합니다. 서비스가 이미 귀하의 현재 위치와 원하는 것을 알고 있고 필요한 정보를 직접 찾을 필요가 없는 경우입니다.

빅데이터 활용의 또 다른 유망 분야는 교육이다.

버지니아의 미국 대학 중 한 곳에서 소위 위험 그룹의 학생들에 대한 데이터를 수집하기 위한 연구가 수행되었습니다. 이들은 공부를 잘 못하고 수업을 빼먹고 자퇴를 앞둔 사람들입니다. 사실은 매년 주에서 약 400 명이 공제된다는 것입니다. 이것은 등급이 낮아지고 자금이 삭감된 대학과 학생들 모두에게 좋지 않습니다. 많은 사람들이 교육을 위해 대출을 받고 공제 후에도 여전히 상환해야 합니다. 잃어버린 시간과 경력 전망은 말할 것도 없습니다. 빅 데이터의 도움으로 뒤처진 시간을 식별하고 튜터, 추가 수업 및 기타 대상 지원을 제공할 수 있습니다.

그건 그렇고, 이것은 학교에도 적합합니다. 그러면 시스템이 교사와 부모에게 알릴 것입니다. 그들은 아이에게 문제가 있으니 함께 도와 주자고 말합니다. 빅 데이터는 또한 어떤 교과서가 더 잘 작동하고 어떤 교사가 자료를 더 쉽게 설명하는지 이해하는 데 도움이 됩니다.

또 다른 긍정적인 예는 경력 프로파일링입니다.: 청소년들이 진로를 결정하는데 도움을 받는 시기입니다. 여기에서 빅 데이터를 사용하면 기존 테스트로는 얻을 수 없는 정보, 즉 사용자의 행동 방식, 주의를 기울이는 것, 콘텐츠와 상호 작용하는 방식 등의 정보를 수집할 수 있습니다.

같은 미국에는 SC ACCELERATE라는 진로 안내 프로그램이 있습니다. 무엇보다도 CareerChoice GPS 기술을 사용합니다. 학생들의 성격, 과목에 대한 성향, 강점과 약점에 대한 데이터를 분석합니다. 그런 다음 데이터는 청소년이 자신에게 적합한 대학을 선택하는 데 사용됩니다.


하나의 채널에서 기술, 혁신, 경제, 교육 및 공유를 제공하는 Yandex.Zen을 구독하고 팔로우하세요.

댓글을 남겨주세요.