OpenAI daje ChatGPT-u glas za odgovaranje na upite i naredbe

Čitatelji poput vas podržavaju MUO. Kada kupujete koristeći veze na našoj stranici, možemo zaraditi partnersku proviziju. Čitaj više.

ChatGPT bi trebao postati interaktivno generativno AI iskustvo. OpenAI je otkrio da će vodeći svjetski AI chatbot moći govoriti i odgovarati na korisničke upite koristeći sintetizirani, vjerojatno generirani AI, glas.

Zajedno sa svojim novootkrivenim glasom, ChatGPT će također moći odgovoriti i raspravljati o određenim slikama koje su učitane ili snimljene tijekom korištenja ChatGPT Android ili iOS aplikacije. Značajka prepoznavanja slike zvuči slično Google Lensu i drugim aplikacijama koje koriste neuronske mreže za točno otkrivanje podataka i informacija.

kako proslijediti Outlook e -poštu na gmail

OpenAI daje ChatGPT-u glas

Dana 25. rujna 2023., ChatGPT programer OpenAI otkriven dao bi glas svom vodećem svjetskom generativnom AI chatbotu. Korisnici ChatGPT-a mogu razgovarati izravno s chatbotom i zatražiti da im uzvrati, omogućujući ChatGPT-u da po prvi put izravno razgovara glasom.

OpenAI-jev primjer isječka prikazuje ženu koja traži od ChatGPT-a da stvori jedinstvenu priču za laku noć, na što ChatGPT uredno odgovara sintetiziranim ženskim glasom.

Prema Ožičeno , novi model pretvaranja teksta u govor razvijen je unutar tvrtke. Može generirati zvuk 'kao kod ljudi' iz teksta i nekoliko sekundi uzorka govora ( pomoću modela OpenAI Whisper ) i govore različitim tonovima i stilovima. Možete pronaći niz glasovnih uzoraka na OpenAI blog .

Neke tvrtke već koriste OpenAI-jev novi glasovni model. Na primjer, Spotify koristi OpenAI-jev model pretvaranja teksta u govor za prevođenje podcasta na različite jezike, kombinirajući ChatGPT-ovo umijeće prevođenja jezika s novom sposobnošću govora.

ChatGPT-ov novi model pretvaranja teksta u govor dostupan je samo pretplatnicima Plus i Enterprise koji koriste službene aplikacije za Android i iOS i očekuje se da će biti uveden u sljedeća dva tjedna (počevši od 25. rujna 2023.). Nadalje, nova glasovna značajka u početku je ograničena na engleski, iako bismo očekivali da će se to brzo promijeniti.

kako promijeniti orijentaciju stranice u google docs

ChatGPT može prepoznati i fotografije

Drugi dio OpenAI-jevog ChatGPT ažuriranja je mogućnost analiziranja i razgovora o slikama prenesenim na alat. Opcija vizualne analize slike predstavljena je u videozapisima ažuriranja GPT-4, ali od tada se o njoj nije puno raspravljalo ( Na stranu ChatGPT Tumač koda ).

Sada ChatGPT dobiva funkcionalnost sličnu Google Lensu. Možete prenijeti sliku na ChatGPT ili snimiti fotografiju pomoću kamere pametnog telefona u aplikaciji ChatGPT, a ona će prikazati detalje slike, dodajući više konteksta gdje je potrebno.

Nazivajući ga 'sličnim Google Lensu' zapravo je nepravda. Mogućnost čavrljanja naprijed-natrag o slici radi dobivanja više informacija i konteksta čini je izuzetno korisnom za širok raspon postavki. Međutim, važno je primijetiti sitni tisak, pri čemu OpenAI jasno daje do znanja da je ograničio ChatGPT-ovu 'sposobnost analiziranja i davanja izravnih izjava o ljudima' iz razloga privatnosti i točnosti. Ipak, može li se u budućnosti raditi na alatu 'Tko je ovo' koji pokreće OpenAI? (Nadajmo se da neće!)

Kao i novi model pretvaranja teksta u govor, OpenAI će pokrenuti prepoznavanje slika u sljedeća dva tjedna, iako će biti dostupan na svim platformama, ne samo u aplikaciji ChatGPT.

kako strujati vlc na chromecast

Privatnost, sigurnost i druga pitanja

Implikacije glasovnog ChatGPT-a su oštre. Naravno, uzbudljivo je. Međutim, mogućnost stvaranja jedinstveno sintetiziranog glasa korištenjem samo kratkog isječka kao primjera ima značajna pitanja privatnosti i sigurnosti. Potencijal za zlonamjerne aktere da iskoriste ove alate je ogroman, i kao sa svakim generativnim AI alatom, kada duh izađe iz boce, apsolutno se više neće vratiti u nju. Nikakva količina regulacije AI od strane vlada ili vodećih ljudi ne može se vratiti plima.

Čini se da čak i OpenAI-jevo upozorenje na tu temu zaobilazi očito unatoč spominjanju problema:

Međutim, ove mogućnosti također predstavljaju nove rizike, kao što je mogućnost zlonamjernih aktera da se lažno predstavljaju kao javne osobe ili počine prijevaru. To je razlog zašto koristimo ovu tehnologiju za pokretanje specifičnog slučaja upotrebe—glasovni chat.

S obzirom na to da je ovo vrh ledenog brijega, očekujte otpor novootkrivenom glasu ChatGPT-a, osobito nakon što se predvidivi porast neugodnih naslova u kojima se tvrdi da se ChatGPT koristi za prijevaru i tako dalje.

OpenAI pretvara ChatGPT u aplikaciju za umjetnu inteligenciju

Što više OpenAI dodaje značajke prilagođene korisniku ChatGPT-u, to više postaje generativna AI aplikacija. Kao prva koja je dosegla široku slavu tijekom početnog generativnog procvata umjetne inteligencije, ChatGPT još uvijek prednjači i jedina je aplikacija koju neki koriste, unatoč konkurenciji poput Google Barda (i potencijalno Google Geminija) i Claudea iz Anthropica.

Sve dok OpenAI može nastaviti dodavati značajke koje ChatGPT čine lakšim za korištenje, držat će ljude zaokupljenima i gurati sve bliže svom cilju istinski multimodalnog AI alata.