Lemon Slice, nowy start-up technologiczny, zebrał 10,5 miliona dolarów z funduszy zalążkowych pod przewodnictwem Matrix Partners i Y Combinator na opracowanie najnowocześniejszej technologii cyfrowych awatarów. Celem firmy jest wypełnienie luki między tekstowymi agentami AI a interaktywnymi doświadczeniami wideo, tworząc cyfrowe doświadczenia na żywo, w których można prowadzić rozmowy w czasie rzeczywistym.
Problem z istniejącymi awatarami
Istniejące rozwiązania w zakresie awatarów cyfrowych są często niezgrabne, nienaturalne i brakuje im prawdziwego zaangażowania. Większość ludzi wpada w tak zwaną „dolinę niesamowitości” – przez chwilę wygląda realistycznie, a następnie przerywa immersję sztywnymi ruchami lub nienaturalnymi reakcjami. Uniemożliwia to szersze przyjęcie pomimo rosnącego zapotrzebowania na interaktywnych asystentów AI.
Metoda plasterka cytryny
Lemon Slice rozwiązuje ten problem dzięki Lemon Slice-2, modelowi dyfuzji zawierającemu 20 miliardów parametrów, zdolnemu do generowania wysokiej jakości cyfrowych awatarów z pojedynczego obrazu. Kluczem jest uniwersalne podejście, które pozwala uniknąć specjalizacji, pozwalając na tworzenie postaci zarówno ludzkich, jak i nieludzkich. Technologia działa na standardowym sprzęcie (jeden procesor graficzny przy 20 klatkach na sekundę) i jest dostępna za pośrednictwem interfejsu API lub wbudowanego widgetu.
Oznacza to, że firmy mogą przy minimalnym wysiłku zintegrować realistyczne, interaktywne awatary ze swoimi witrynami internetowymi lub aplikacjami. Awatary korzystają również z technologii generowania głosu ElevenLabs, zapewniając płynne i naturalne interakcje audio.
Dlaczego to jest ważne
Przejście na agentów AI opartych na wideo jest nieuniknione. Ludzie wolą naukę wizualną i zaangażowanie – na przykład wielu uczy się lepiej z filmów na YouTube niż z czytania tekstu. Technologia Lemon Slice może otworzyć nowe możliwości w edukacji, obsłudze klienta, handlu elektronicznym i szkoleniach korporacyjnych.
Konkurencja i przewagi
Startup boryka się z konkurencją ze strony takich firm jak D-ID, HeyGen, Synthesia i innych. Inwestorzy uważają jednak, że Lemon Slice ma wyraźną przewagę: koncentruje się na uogólnionym modelu dyfuzji i zespole technicznym z udokumentowanym doświadczeniem w zakresie uczenia maszynowego.
Według partnera Matrix, Ilyi Sukhar, podejście firmy jest bardziej skalowalne niż rozwiązania konkurencji, które ograniczają się do określonych scenariuszy lub branż. Jared Friedman z Y Combinator dodaje, że Lemon Slice to jedyna firma stosująca fundamentalne podejście do uczenia maszynowego, które może ostatecznie pokonać Dolinę Niesamowitości i przejść test Turinga dla awatarów.
Finansowanie i plany na przyszłość
Runda zalążkowa o wartości 10,5 miliona dolarów obejmuje inwestycje dyrektora technicznego Dropbox Arasha Ferdowsiego, dyrektora generalnego Twitcha Emmetta Sheara i The Chainsmokers, co wskazuje na szerokie zainteresowanie tą technologią. Lemon Slice planuje wykorzystać te fundusze na rozbudowę zespołu inżynierów, skalowanie działań marketingowych i pokrycie znacznych kosztów obliczeniowych szkolenia modelu.
Firma współpracuje już z anonimowymi organizacjami z dziedzin edukacji, nauki języków i handlu elektronicznego.
Sukces Lemon Slice zależy od tego, czy firma będzie w stanie dostarczać konsekwentnie fotorealistyczne awatary, które naprawdę poprawiają wrażenia użytkownika. Jeśli się powiedzie, technologia ta może na nowo zdefiniować sposób interakcji z asystentami AI, czyniąc ich bardziej zrozumiałymi i wciągającymi niż kiedykolwiek wcześniej.
