Meta przyspiesza rozwój sztucznej inteligencji opartej na głosie, ponieważ firma ma na celu zrewolucjonizowanie rynku

Mark Zuckerberg intensyfikuje rozwój AI głosowego w Meta, koncentrując się na udoskonaleniu funkcjonalności głosowych w nadchodzącym wydaniu Llama 4. Organizacja dąży do tego, aby jej AI ułatwiało naturalne konwersacje, umożliwiając płynne interakcje między użytkownikami a systemem. Ponieważ Meta dąży do dominacji w sektorze AI, rozważa również wprowadzenie płatnych subskrypcji i reklam w celu monetyzacji postępu tej technologii.

Meta przyspiesza rozwój sztucznej inteligencji opartej na głosie, ponieważ firma ma na celu zrewolucjonizowanie rynku

fot.: Hengki Tj // Shutterstock

Według źródeł z Financial Times organizacja zamierza włączyć ulepszone funkcje głosowe do swojego najnowszego modelu języka open source, Llama 4, który ma zostać uruchomiony w nadchodzących tygodniach. Firma liczy na to, że tak zwani agenci napędzani przez AI będą skupieni na rozmowie, a nie na tekście.

Meta stawia rozmowy głosowe ponad stałe odpowiedzi

Firma dąży do tego, aby wymiana informacji między użytkownikami a modelem głosowym była bardziej organiczna, przypominała dwustronną rozmowę i pozwalała na przerywanie przez użytkowników zamiast zadawania sztywnych pytań i odpowiedzi.

Ta zmiana w kierunku AI głosowej pokrywa się z ambitną wizją Zuckerberga, aby umieścić Meta jako lidera w dziedzinie AI, a rok 2025 jest rokiem przełomowym dla różnych produktów firmy opartych na AI. Meta konkuruje z rywalami, takimi jak OpenAI, Microsoft i Google, aby monetyzować tę technologię.

W związku z tym firma rozważa testy płatnych subskrypcji swojego asystenta AI Meta AI, który ułatwiłby zadania związane z funkcjami opartymi na agencie, takimi jak rezerwacje lub tworzenie filmów, jak donosi Financial Times. Ponadto organizacja bada możliwość zintegrowania płatnych reklam lub sponsorowanych postów z wynikami wyszukiwania swojego asystenta AI.

Zuckerberg ujawnił zamiar opracowania agenta AI, który posiadałby umiejętności programowania i rozwiązywania problemów porównywalne z umiejętnościami inżyniera średniego szczebla, co jego zdaniem mogłoby wygenerować „bardzo duży rynek”.

Meta powstrzymał się od komentarza dla Financial Times.

Tłumaczenie mowy ojczystej kontra tłumaczenie tekstu

Chris Cox, dyrektor ds. produktów w grupie, podzielił się 5 marca swoimi spostrzeżeniami na temat planów dotyczących Llama 4, stwierdzając, że będzie ona funkcjonować jako „model wszechobecny”, w którym mowa będzie „rodzima… zamiast konwertować głos na tekst, wysyłać tekst do LLM, odbierać tekst, a następnie przekształcać go z powrotem na mowę”.

Podczas prezentacji na konferencji technologicznej Morgan Stanley dodał: „Uważam, że jest to znaczący postęp w zakresie interfejsu

Źródło

No votes yet.
Please wait...

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *