Google përdor të dhënat e përdoruesve për të trajnuar AI

Google ka përditësuar politikën e tij të privatësisë për të sqaruar se të dhënat publike të përdoruesve mund të përdoren për trajnimin e modeleve të AI, si ai pas Bard. Ky lloj informacioni duhet të bëhet i detyrueshëm me hyrjen në fuqi të Aktit të AI. Megjithatë, chatbot-i i kompanisë Mountain View nuk është ende i aksesueshëm në Evropë për shkak të çështjeve të privatësisë.

Të dhënat publike i janë dhënë AI
Versioni i ri i politikës u publikua më 1 korrik. Siç e dinë shumë, OpenAI “grumbullon” të dhëna nga interneti për trajnimin ChatGPT. Edhe Google tani e ka konfirmuar këtë aktivitet të skrapimit me synim transparencën dhe detyrimet ligjore. Deri më 30 qershor, në rubrikën “Burimet e aksesueshme nga publiku” shkruhej:

Për shembull, ne mund të mbledhim informacione të disponueshme publikisht në internet ose nga burime të tjera publike për të ndihmuar në trajnimin e modeleve gjuhësore të Google dhe ndërtimin e veçorive si Google Translate. Ose, nëse informacioni i biznesit tuaj shfaqet në një faqe interneti, ne mund t’i indeksojmë dhe t’i shfaqim në shërbimet e Google.

Në versionin e përditësuar më 1 korrik shkruhet:

Për shembull, ne mund të mbledhim informacione të disponueshme publikisht në internet ose nga burime të tjera publike për të ndihmuar në trajnimin e modeleve të AI të Google dhe në ndërtimin e produkteve dhe veçorive të tilla si veçoritë e Google Translate, Bard dhe AI ​​Cloud. Ose, nëse informacioni i biznesit tuaj shfaqet në një faqe interneti, ne mund t’i indeksojmë dhe t’i shfaqim në shërbimet e Google.

Kompania Mountain View më pas specifikoi se të dhënat publike të përdoruesve mund të përdoren për të trajnuar modelet e AI. Të dhënat publike nuk nënkuptojnë vetëm ato të disponueshme në shërbimet e Google, por të gjitha ato që ndahen në internet. Prandaj, përdoruesit duhet t’i kushtojnë vëmendje informacionit të ndjeshëm të postuar në blogje, forume ose media sociale.

Një firmë ligjore amerikane së fundmi paditi OpenAI dhe Microsoft për “vjedhje” të të dhënave të përdoruesve pa pëlqimin e tyre. Twitter ka kufizuar leximin e tweet-eve për të ndaluar grumbullimin e të dhënave.


This is a companion discussion topic for the original entry at https://zero1.al/2023/07/04/google-perdor-te-dhenat-e-perdoruesve-per-te-trajnuar-ai/