Gemini AI: os desafios da inteligência artificial do Google

Stella

2 anos atrás

Gemini AI: A inteligência artificial do Google que terá dificuldade em recuperar a confiança do público

Gemini AI é a inteligência artificial do Google que passou recentemente por uma grande polêmica. Neste conteúdo, você entenderá mais sobre o problema e teremos uma discussão sobre como isso aconteceu.

Gemini AI: A “revolução” da inteligência artifical com compreensão visual

Hoje em dia, tornou-se comum falar sobre inteligência artificial devido ao cenário em que estamos imersos.

O Gemini AI é uma iniciativa da Google, buscando ser a inteligência artificial principal da empresa entre as diversas existentes.

Já havia muitos rumores de que a empresa estava treinando sua inteligência artificial com a vasta base de informações que o Google possui.

Porém, o fato é que o Gemini apareceu em um vídeo lançado no canal do Youtube oficial do Google chamado de “Hands-on with Gemini: Interacting with Multimodal AI”.

O projeto atraiu uma considerável atenção global devido à versatilidade que a empresa incorporou na inteligência artificial.

O que acontece no vídeo de anúncio?

A câmera não mostra o apresentador e aparenta ser um vídeo bastante simples de anúncio, justamente pela aparente pouca edição.

O apresentador mostra apenas a sua mão em uma mesa enquanto vemos a conversa entre ele e a inteligência artificial.

Muitas vezes, a tela se divide, repetidamente, para mostrar as funções da IA. A primeira cena é o apresentador desenhando um pato, mas a inteligência artificial reconhece as linhas iniciais e o resultado final, mostrando ser algo nunca antes visto.

Assim que reconhece o pato, o apresentador pede para a inteligência artificial citar como seria a palavra “pato” em outro idioma e pede para que a IA o ajude na pronúncia, da forma, em Mandarim.

Na cena seguinte, o Gemini AI cria um jogo de adivinhação com base no mapa-múndi que é mostrado na mesa e se demonstra bem responsivo.

Também vemos, na cena seguinte, que a IA consegue resolver quebra-cabeças visuais quando o apresentador esconde uma bola de papel dentro do copo.

Na outra cena, é mostrada a capacidade da inteligência artificial de reconhecer conexões entre objetos mostrados na mesa.

No primeiro exemplo, é mostrado um cookie e uma moeda. A inteligência artificial consegue identificar que ambos são redondos.

Também vemos, na cena subsequente, a criação de imagens com base em objetos apresentados e o uso de raciocínio lógico na cena seguinte.

Por fim, no vídeo, é mostrada a compreensão da cultura baseando-se em vídeos e a tradução de elementos visuais.

O que gerou a polêmica?

Se você leu a descrição no tópico anterior e assistiu ao vídeo de apresentação, provavelmente ficou impressionado com os recursos, já imaginando nas diversas áreas em que isso poderia ser aplicado, socialmente, e como seria interessante para todos.

Por isso, o vídeo chegou rapidamente a um milhão de visualizações e, neste momento, está com quase 3 milhões de visualizações.

Não demorou muito para especialistas no assunto desconfiarem, comentarem sobre e a própria Google falar sobre isso.

Oriol Vinyals, co-diretor da empresa, respondeu à questão. Segundo Vinyals, o vídeo de apresentação do Gemini tinha o objetivo apenas de inspirar os desenvolvedores ou, em um bom português, era mentira.

Não sabemos o quanto o vídeo de apresentação não mostra a realidade, mas o fato é que a inteligência artificial não será daquela forma.

Por que é falso?

Assim como em toda apresentação, a Google provavelmente teve grandes ganhos com o vídeo. No entanto, esses ganhos se dissiparam e abalaram a confiança na empresa depois de se mostrar falso.

O Gemini não funcionará com a potência, precisão e qualidade mostradas no vídeo porque, basicamente, tudo foi montado.

Desde as respostas até a compreensão rápida de reconhecimento de imagens, que surpreendeu a todos se fosse verdade. Provavelmente, você já viu um trailer de filme impressionante, mas quando saiu da sala de cinema se arrependeu.

O mesmo aconteceu com o Gemini. É importante dizer que não estamos afirmando que essas funções não estão presentes na inteligência artificial da Google, mas que, como não foram realmente mostradas, esperamos algo inferior.

Diferenças nas interações

O reconhecimento de imagem provavelmente será algo que veremos na IA, principalmente com o uso de outros produtos do Google, mas não com a precisão “apresentada”.

Hoje, existe a tecnologia de reconhecimento de imagem de ponta para realizar tarefas simples, principalmente no setor industrial.

No entanto, são tarefas simples e, até o momento, não é possível garantir essa quantidade de ações que vemos no vídeo.

É provável que as respostas e interações via texto e áudio sejam mais próximas do produto final, já que são mais simples de serem feitas e temos diversos exemplos no mercado.

Realmente, a principal diferença que veremos em relação ao produto final é o reconhecimento de imagem. Provavelmente, só veremos esse salto na realidade em algumas décadas.

Falta de transparência inesperada

O maior choque realmente foi a falta de transparência da empresa com os seus usuários e com o mercado.

Afinal, é possível imaginar uma situação parecida com um desenvolvedor ou até mesmo um editor de vídeos, onde seria interessante pela criatividade.

No entanto, como estamos falando de uma das maiores empresas do mundo inteiro, isso manchou para sempre a imagem do Google nesse campo tão importante dos próximos anos.

Não só será difícil recuperar a credibilidade de forma geral, como será ainda mais complicado desenvolver o Gemini.

Afinal, as pessoas serão mais relutantes ao utilizar a IA do Google, principalmente com o ChatGPT melhorando a cada dia e outras formas de IA como a Siri ou Alexa.

Conclusão

Apesar de tudo, o vídeo falso de apresentação serviu para mostrar que a inteligência artificial é uma tecnologia maravilhosa que ainda vai crescer muito, mas não é onipotente, não é verdade?

Temos essa visão da inteligência artificial muito pelo imaginário popular criado pelos livros clássicos de ficção científica e os filmes do final do século.

Entretanto, quando chegarmos ao limite da inteligência artificial, teremos expectativas muito mais claras do que essa tecnologia pode fazer na realidade.

Esperamos que a Gemini AI seja bem trabalhada e que a Google entregue mais um produto de qualidade para nós, usuários.

Para ver mais conteúdos como esse, acesse nosso blog!