A Apple anunciou recentemente o lançamento de mais uma ferramenta de inteligência artificial que terá como principal objetivo editar imagens a partir de comandos de texto. O recurso foi batizado como MLLM-Guided Image Editing (MGIE, na sigla em inglês), resultado de uma colaboração com a Universidade da Califórnia, Santa Barbara, Estados Unidos.
De acordo com o que foi antecipado pela empresa, a ferramenta vai permitir com que as pessoas realizem diversas operações, como cortar, redimensionar, orientar, adicionar ou remover filtros e mais seguindo prompts fornecidos pelo usuário, assim como em geradores de imagens com IA.
Os comandos de edição poderão ser feitos a partir dos comandos de texto, com diversas possiblidades. Dentre os exemplos citados na documentação da Apple estão orientações como "torne essa receita mais saudável", fazendo a IA adiciona vegetais numa pizza, e "adicione contraste para simular mais luz".
Dentre os recursos esperados que essa ferramenta vai ser capaz de fazer estão:
- Edição baseada em instruções;
- Modificações e ajustes no estilo Photoshop;
- Otimização geral de uma foto;
- Modificações localizadas numa imagem.
Em termos gerais, a IA da Apple consegue fazer uma infinidade de alterações num arquivo, incluindo ajustes finos de contraste, brilho e temperatura de cor, bem como adicionar e remover objetos.
Neste primeiro momento a ferramenta ainda está em fase de testes e reconhecimento da comunidade de uma forma geral. O projeto foi inserido no GitHub, plataforma de compartilhamento de arquivos e códigos de programação. Também foi disponibilizada uma demonstração web no Hugging Face Spaces, outro repositório online.
Por enquanto, ela ainda não tem data prevista para ser oferecida para os usuários de uma forma geral.