Prompt injection usa resumos do ChatGPT para exibir links maliciosos

Uma técnica chamada ChatGPhish mostrou como páginas web podem ser manipuladas para transformar resumos gerados pelo ChatGPT em superfícies de phishing.

O ataque explora instruções maliciosas escondidas em conteúdos que o usuário pede para a IA resumir.

A técnica foi descrita como uma forma de prompt injection baseada no navegador.

Em vez de atacar diretamente o usuário por e-mail, o invasor insere comandos em páginas públicas, como documentações, blogs, dashboards ou arquivos README.

Quando a página é resumida, essas instruções podem influenciar a resposta exibida pelo assistente.

O resultado pode incluir links maliciosos, alertas falsos de segurança, imagens externas e QR Codes apresentados dentro da interface confiável do ChatGPT.

O risco está na transferência de confiança. Como o conteúdo aparece formatado na janela da IA, a vítima pode acreditar que links ou avisos foram gerados de forma legítima pelo assistente, quando na verdade foram controlados pelo texto da página original.

Um dos cenários envolve links em Markdown renderizados como elementos clicáveis. Outro usa mensagens falsas com aparência de alerta de conta, induzindo o usuário a acessar páginas de login fraudulentas ou seguir instruções preparadas pelo invasor.

A técnica também pode usar QR Codes carregados de infraestrutura externa. Esse método dificulta a análise por proteções tradicionais do desktop, já que o destino real só aparece quando a vítima escaneia o código em outro dispositivo.

Leia mais na mesma categoria:

NotíciasVulnerabilidades