Google I/O:n parhaat tekoälyilmoitukset | Cilostazol

The top AI announcements from Google I/O

Google on panostanut tekoälyyn – ja se haluaa sinun tietävän sen. Yrityksen pääpuheenvuoron aikana I/O-kehittäjäkonferenssissaan tiistaina Google mainitsi “AI:n” yli 120 kertaa. Se on paljon!

Mutta kaikki Googlen tekoälyilmoitukset eivät itsessään olleet merkittäviä. Jotkut olivat asteittain. Toiset tutkittiin uudelleen. Auttaaksemme lajittelemaan vehnää akanoista kokosimme yhteen parhaat uudet tekoälytuotteet ja -ominaisuudet, jotka paljastettiin Google I/O 2024 -tapahtumassa.

Google aikoo käyttää generatiivista tekoälyä kaikkien Googlen hakutulossivujen järjestämiseen.

Miltä tekoälyn järjestämät sivut näyttävät? No, se riippuu hakukyselystä. Mutta ne voivat näyttää tekoälyn luomia yhteenvetoja arvosteluista, keskusteluja sosiaalisessa mediassa, kuten Redditistä, ja tekoälyn luomia ehdotusluetteloita, Google sanoi.

Toistaiseksi Google aikoo näyttää tekoälyllä tehostettuja tulossivuja, kun se havaitsee, että käyttäjä etsii inspiraatiota – esimerkiksi matkaa suunnitteleessaan. Pian se näyttää myös nämä tulokset, kun käyttäjät etsivät ruokailuvaihtoehtoja ja reseptejä, ja tuloksia on tulossa elokuvista, kirjoista, hotelleista, sähköisestä kaupankäynnistä ja muusta.

Project Astra ja Gemini Live

Kuvan luotto: Google google

Google parantaa tekoälyllä toimivaa chatbottiaan Geminiä, jotta se voi ymmärtää paremmin ympäröivää maailmaa.

Yhtiö esitteli uutta Gemini-kokemusta nimeltä Gemini Live, jonka avulla käyttäjät voivat käydä “syvällisiä” äänikeskusteluja Geminin kanssa älypuhelimissaan. Käyttäjät voivat keskeyttää Geminin chatbotin puhuessa esittääkseen selventäviä kysymyksiä, ja se mukautuu heidän puhemalleihinsa reaaliajassa. Ja Gemini näkee käyttäjien ympäristön ja reagoi siihen joko valokuvien tai älypuhelimen kameroiden tallentamien videoiden avulla.

Gemini Live – joka julkaistaan ​​vasta myöhemmin tänä vuonna – voi vastata kysymyksiin, jotka koskevat älypuhelimen kameran näkyvissä (tai äskettäin näkyvissä) olevia asioita, kuten missä naapurustossa käyttäjä saattaa olla tai rikkoutuneen osan nimi. auton pyörä. Liveä tukevat tekniset innovaatiot johtuvat osittain Project Astrasta, DeepMindin uudesta aloitteesta luoda tekoälyllä varustettuja sovelluksia ja “agentteja” reaaliaikaista, multimodaalista ymmärtämistä varten.

Google Veo

Valitettavasti
Kuvan luotto: Google

Google etsii OpenAI:n Soraa Veolla, tekoälymallilla, joka voi luoda noin minuutin pituisia 1080p-videoleikkeitä, kun sille annetaan tekstikehote.

Veo voi kaapata erilaisia ​​visuaalisia ja elokuvallisia tyylejä, mukaan lukien kuvamateriaalia maisemista ja aikaviiveistä, sekä muokata ja muokata jo luotua materiaalia. Malli ymmärtää kameran liikkeet ja VFX:n kohtuullisen hyvin kehotteista (ajattele kuvauksia, kuten “pan”, “zoom” ja “räjähdys”). Ja Veolla on melkoinen ymmärrys fysiikasta – esimerkiksi nestedynamiikasta ja painovoimasta –, mikä lisää luomiensa videoiden realistisuutta.

Veo tukee myös peitettyä editointia videon tiettyjen alueiden muutoksille ja voi luoda videoita still-kuvasta, à la generatiivisia malleja, kuten Stability AI:n Stable Video. Ehkä kiehtovinta on, että Veo voi luoda pidempiä videoita – yli minuutin pitkiä videoita, kun otetaan huomioon kehotteet, jotka yhdessä kertovat tarinan.

Pyydä kuvia

Kuvan luotto: TechCrunch

Google Photos saa tekoälyn infuusion käynnistämällä kokeellisen Ask Photos -ominaisuuden, joka perustuu Googlen Gemini generatiivisten tekoälymallien perheeseen.

Myöhemmin tänä kesänä julkaistavan Ask Photos -palvelun avulla käyttäjät voivat tehdä hakuja Google Photos -kokoelmastaan ​​käyttämällä luonnollisen kielen kyselyitä, jotka hyödyntävät Geminin ymmärrystä valokuvien sisällöstä – ja muista metatiedoista.

Esimerkiksi sen sijaan, että he olisivat etsineet kuvasta tiettyä asiaa, kuten “One World Trade”, käyttäjät voivat tehdä paljon laajempia ja monimutkaisempia hakuja, kuten löytää “parhaan kuvan kustakin kansallispuistosta , kävin Tässä esimerkissä Kaksoset käyttäisivät vihjeitä, kuten valaistusta, epäterävyyttä ja taustan vääristymättömyyttä, määrittääkseen, mikä tekee kuvasta “parhaan” tietyssä joukossa, ja yhdistävät sen maantieteellisen sijainnin ja päivämäärän ymmärtämiseen palauttaakseen kuvan. asiaankuuluvia kuvia.

Kaksoset Gmailissa

Kuvan luotto: TechCrunch

Gmailin käyttäjät voivat pian etsiä, tehdä yhteenvetoja ja luonnostella sähköposteja Geminin ansiosta – sekä käsitellä sähköposteja monimutkaisemmissa tehtävissä, kuten palautusten käsittelyssä.

I/O:n demossa Google osoitti, kuinka vanhempi voi pysyä ajan tasalla, mitä lapsensa koulussa tapahtuu, pyytämällä Geminiä tekemään yhteenvedon kaikista koulun viimeaikaisista sähköposteista. Itse sähköpostien lisäksi Gemini analysoi myös liitteitä, kuten PDF-tiedostoja, ja sylkee yhteenvedon tärkeimmistä kohdista ja toimintakohdista.

Gmailin sivupalkista käyttäjät voivat pyytää Geminiä auttamaan heitä järjestämään sähköpostinsa kuitit ja jopa tallentamaan ne Google Drive -kansioon tai poimimaan kuiteista tietoja ja liittämään ne laskentataulukkoon. Jos teet sitä usein – esimerkiksi liikematkustajana, joka seuraa kuluja – Gemini voi myös tarjota työnkulun automatisointia tulevaa käyttöä varten.

Petosten havaitseminen puheluiden aikana

Kuvan luotto: Google

Google esikatseli tekoälyllä toimivan ominaisuuden, joka varoittaa käyttäjiä mahdollisista huijauksista puhelun aikana.

Androidin tulevaan versioon rakennettava ominaisuus käyttää Gemini Nanoa, Googlen generatiivisen AI-tarjouksen pienintä versiota, joka voi toimia kokonaan laitteella, kuunnellakseen “petoksiin yleisesti liittyviä keskustelumalleja” reaaliajassa.

Ominaalle ei ole asetettu erityistä julkaisupäivää. Kuten monet näistä asioista, Google esikatselee, kuinka paljon Gemini Nano pystyy tekemään matkalla. Tiedämme kuitenkin, että ominaisuus on valinnainen – mikä on hyvä asia. Vaikka Nanon käyttö tarkoittaa, että järjestelmä ei lataa ääntä automaattisesti pilveen, järjestelmä kuuntelee silti tehokkaasti käyttäjien keskusteluja – mahdollinen tietosuojariski.

AI esteettömyys

Kuvan luotto: Google

Google parantaa Androidin TalkBack-käyttöapuominaisuuttaan generatiivisella tekoälytaikuudella.

Pian TalkBack napauttaa Gemini Nanoa luodakseen äänikuvauksia kohteista näkövammaisille ja sokeille käyttäjille. Esimerkiksi TalkBack voi kuvata vaatekappaletta seuraavasti: “Lähikuva mustavalkoisesta gingham-mekosta. Mekko on lyhyt, siinä on kaulus ja pitkät hihat. Se solmitaan vyötäröltä suurella rusetilla.”

Googlen mukaan TalkBackin käyttäjät näkevät noin 90 merkitsemätöntä kuvaa päivässä. Nanoa käyttämällä järjestelmä pystyy tarjoamaan käsityksen sisällöstä – mahdollisesti luopumaan tarpeesta, että joku syöttää nämä tiedot manuaalisesti.

Julkaisemme AI-uutiskirjeen! Rekisteröidy tässä alkaa vastaanottaa sitä postilaatikoihisi 5. kesäkuuta.

Lue lisää Google I/O 2024:stä TechCrunchissa

Leave a Reply

Your email address will not be published. Required fields are marked *