Recent, cercetătorul de inteligență artificială Simon Willison a vrut să-și adună tarifele de la utilizarea unui serviciu cloud, dar valorile și datele de plată de care avea nevoie au fost împrăștiate între o duzină de e-mailuri separate. Introducerea lor manuală ar fi fost plictisitoare, așa că a apelat la o tehnică pe care o numește „video scraping”, care implică introducerea unui videoclip de înregistrare a ecranului într-un model AI, similar cu ChatGPT, în scopuri de extracție a datelor.

Ceea ce a descoperit pare simplu la suprafață, dar calitatea rezultatului are implicații mai profunde pentru viitorul asistenților AI, care ar putea în curând să vadă și să interacționeze cu ceea ce facem pe ecranele computerelor noastre.

„Zilele trecute m-am trezit nevoit să adun niște valori numerice care erau împrăștiate în douăsprezece e-mailuri diferite”, a scris Willison într-un post detaliat pe blogul lui. A înregistrat un videoclip de 35 de secunde, derulând prin e-mailurile relevante, apoi a introdus acel videoclip Google AI Studio instrument, care permite oamenilor să experimenteze mai multe versiuni ale Google Gemini 1.5 Pro și modele Gemini 1.5 Flash AI.

Citiți articolul integral

Comentarii

Chat Icon
×