01 de jul 2025

Gemini e ChatGPT ganham função de visão com câmera do celular em tempo real
Assistentes de IA agora interagem ao vivo com imagens, mas preocupações sobre privacidade e erros de interpretação surgem.

Recursos de vídeo das IAs analisam em tempo real cenas exibidas pela câmera do celular (Foto: Imagem gerada por IA/ChatGPT)
Ouvir a notícia:
Gemini e ChatGPT ganham função de visão com câmera do celular em tempo real
Ouvir a notícia
Gemini e ChatGPT ganham função de visão com câmera do celular em tempo real - Gemini e ChatGPT ganham função de visão com câmera do celular em tempo real
Recentemente, assistentes de inteligência artificial como ChatGPT e Gemini começaram a oferecer interações ao vivo com imagens, permitindo que usuários façam perguntas sobre o ambiente ao seu redor. Essa inovação levanta questões sobre privacidade e confiabilidade das respostas.
Esses sistemas, que já processavam texto e áudio, agora utilizam a câmera do celular para "enxergar" o que está ao redor. Ao ativar essa função, o usuário pode interagir com a IA de forma semelhante ao personagem do filme Her, interpretado por Joaquin Phoenix. A tecnologia permite que a IA explique placas, traduza cardápios e até descreva eventos ao vivo, como partidas de futebol.
Funcionalidades e Usos
Para usar a câmera com a IA, o usuário deve fazer login no aplicativo do Gemini ou do ChatGPT e ativar o recurso "Live". O ChatGPT, disponível apenas para assinantes, oferece uma conversa mais fluida, enquanto o Gemini é gratuito e acessível em dispositivos Android e iOS. A IA do Google também permite responder a perguntas a partir do compartilhamento de tela, facilitando a ajuda em configurações de dispositivos ou análise de gráficos.
Além disso, outros chatbots, como Claude e DeepSeek, permitem o envio de imagens estáticas para análise. Esses sistemas podem interpretar textos, revisar documentos e até sugerir receitas com base em fotos de ingredientes. No entanto, especialistas alertam para a necessidade de cautela, pois a IA pode cometer erros de interpretação.
Questões de Privacidade
A utilização de câmeras levanta preocupações sobre privacidade. A IA pode identificar locais e capturar rostos, o que gera debates sobre a segurança das informações. O ChatGPT, por exemplo, já demonstrou a capacidade de reconhecer ambientes com base em elementos visuais. As interações feitas com o Gemini são armazenadas por até 72 horas, o que também suscita preocupações.
Carlos Rafael Gimenes das Neves, professor da Escola Superior de Propaganda e Marketing, destaca que a visão computacional, embora existente há décadas, ganhou novo impulso com os modelos multimodais. Esses modelos combinam diferentes formas de interação, permitindo que as máquinas respondam de maneira mais complexa e humana. Contudo, a obtenção de dados para treinar esses sistemas ainda é uma questão controversa, envolvendo aspectos éticos e sociais.
Perguntas Relacionadas
Comentários
Os comentários não representam a opinião do Portal Tela;
a responsabilidade é do autor da mensagem.