Assistam ao vídeo recomendado:



 A transcrição desse vídeo encontra-se abaixo:

"Aprendi sobre agentes de IA para você e, por isso, apresento aqui uma versão resumida para poupar semanas de aprendizado. Na verdade, não há um curso que abranja tudo de maneira completa. Sendo assim, realizei três cursos, escrevi vários artigos, assisti a muitos vídeos no YouTube e, claro, também criei meus próprios agentes. Minhas anotações ultrapassam duzentas páginas, mas, como sempre digo, não basta apenas ouvir sobre esses assuntos. Por isso, no final deste vídeo, haverá uma pequena avaliação. Caso você consiga responder às perguntas, parabéns! Você estará informado sobre agentes de IA.

Sem mais delongas, vamos começar. Uma parte deste vídeo é patrocinada pela HubSpot.

Aqui está o esboço inicial do nosso conteúdo. Primeiro, vamos tratar do conceito de agentes de IA, um termo atualmente muito divulgado. Em seguida, realizaremos um curso intensivo sobre arquiteturas multiagentes. Trata-se de um campo de desenvolvimento fascinante, que torna a teoria realmente aplicável à prática. Mostrarei como criar um fluxo de trabalho com agentes de IA, sem a necessidade de escrever código. Confesso que fiquei surpreendido com o poder e a facilidade de utilização desses fluxos.

Finalmente, para aqueles interessados em ingressar nesse campo ou mesmo construir seus próprios agentes de IA para seus negócios, compartilharei um conselho que, quando ouvi pela primeira vez, me impressionou profundamente. Fique atento a esse conselho ao final.

Primeiramente, vamos definir o que são agentes. Pode parecer simples, mas uma das maiores dificuldades que enfrentei ao me aprofundar no tema foi justamente encontrar uma definição clara para "agentes de IA". Isso provavelmente ocorre por ser um campo relativamente novo, em que muitos ainda tentam entender exatamente o que são e como funcionam esses agentes.

Antes deste vídeo, caso você estivesse confuso sobre o conceito, posso assegurar que não é tão complexo quanto parece. Deixe-me explicar isso da maneira mais simples possível.

Para começar, talvez seja mais fácil definir o que não é um agente de IA. Definitivamente, não é um agente de IA se você simplesmente pede a uma inteligência artificial para realizar algo diretamente, processo conhecido como prompting "one-shot". Inclusive, se você tiver interesse em aprimorar suas habilidades em engenharia de prompt, produzi outro vídeo onde resumi o curso de engenharia de prompt do Google, que tem nove horas de duração, em apenas vinte minutos. Recomendo conferir esse conteúdo posteriormente.

Dessa forma, pedir diretamente ao ChatGPT para escrever uma redação completa, de uma só vez, sobre determinado tema, ainda que resulte em um texto coerente, provavelmente gerará uma resposta superficial e distante daquilo que você realmente deseja. Em contrapartida, se você utilizar um fluxo de trabalho baseado em agentes, seus resultados serão significativamente melhores.

Mas como seria isso na prática? Basicamente, consiste em dividir essa tarefa ampla em diferentes etapas menores. Imagine o seguinte: primeiro, você poderia pedir para que a IA escrevesse um esboço sobre o tema; em seguida, consideraria realizar uma pesquisa mais detalhada na internet; posteriormente, escreveria o primeiro rascunho; depois, revisaria quais partes desse rascunho necessitam de ajustes ou aprofundamento; e, finalmente, revisaria novamente o texto até chegar à versão final desejada.

De maneira geral, um fluxo de trabalho sem agentes é linear, começa e termina sem grandes revisões, enquanto um fluxo baseado em agentes possui um caráter iterativo, circular. Nesse fluxo circular, você pensa, pesquisa, produz uma saída, revisa o resultado, reflete novamente, realiza novas pesquisas e continua repetindo esse ciclo até alcançar um resultado satisfatório.

Para adicionar complexidade, temos três níveis de fluxo: um fluxo sem agentes (linear), um fluxo com agentes (iterativo) e um terceiro nível mais avançado, no qual o agente de IA é totalmente autônomo. Este último é o estágio onde desejamos que nossos agentes cheguem um dia: capazes de identificar independentemente todas as etapas necessárias, decidir quais ferramentas usar e percorrer autonomamente o processo de revisão, até obter o resultado final desejado. Contudo, na data em que este vídeo foi gravado, ainda não atingimos esse nível de autonomia. Atualmente, estamos focados principalmente nesse segundo nível, onde há componentes de agentes envolvidos, mas ainda não completamente autônomos.

No entanto, com a velocidade de evolução da inteligência artificial, quem sabe? Talvez daqui a dois meses esse cenário mude completamente. Veremos.


No mundo da IA, atualmente são aceitos amplamente quatro padrões de design de agentes. O primeiro e mais simples é chamado de reflexão. Nesse padrão, você simplesmente pede a uma IA para analisar com maior cuidado seus próprios resultados. Para exemplificar: imagine solicitar à IA que escreva um código para realizar uma tarefa específica. Após gerar o código inicial, você não interrompe o processo. Em vez disso, pede para que a IA examine atentamente o código produzido, verificando sua exatidão, estilo e eficiência, fornecendo também críticas construtivas para melhorá-lo. Durante essa análise, a IA pode perceber, por exemplo, que cometeu um erro na linha cinco. Então, ela própria corrige essa linha e continua aprimorando seu código. Neste padrão, você auxilia a IA a executar esse ciclo iterativo de melhoria contínua da sua própria saída.

Uma extensão simples deste método é, em vez de você mesmo orientar a IA nesse processo reflexivo, criar outro agente de IA para auxiliar o primeiro agente a revisar o próprio código. Essa abordagem é denominada estrutura multiagente, tema que abordaremos mais detalhadamente adiante neste vídeo. Trata-se de um campo extremamente interessante e promissor.

O próximo padrão é o uso de ferramentas, que consiste em fornecer à IA a capacidade de utilizar ferramentas externas para realizar partes específicas de uma tarefa. Por exemplo, imagine que você esteja interessado em adquirir uma nova cafeteira e pergunte à IA qual é o melhor modelo, baseado nas avaliações disponíveis. Se você fornecer à IA a ferramenta de pesquisa na web, ela será capaz de buscar avaliações diversas na internet, compilar as informações encontradas e, então, resumir suas descobertas. O resultado obtido será significativamente superior ao que se obteria pedindo diretamente à IA uma resposta imediata, sem consulta à web.

Outra ferramenta poderosa e frequentemente utilizada é a execução de código, que possibilita à IA realizar cálculos ou até mesmo construir elementos concretos, como sites. Por exemplo, você poderia perguntar à IA quanto teria ao investir US$ 100 a juros compostos de 7% durante 12 anos. Com acesso à ferramenta de execução de código, a IA conseguiria realizar essa tarefa com precisão.

Existem diversas outras ferramentas que podem ser integradas aos agentes de IA, como detecção de objetos, geração de conteúdo para a web ou até mesmo acesso ao seu calendário e e-mails para agendamento automático de eventos. Dessa forma, o uso de ferramentas representa um poderoso padrão de design.

O terceiro padrão é o planejamento e raciocínio. Trata-se da capacidade da IA de receber uma tarefa específica e determinar sozinha todas as etapas necessárias para realizá-la, além das ferramentas apropriadas. Por exemplo, você pode solicitar que uma IA gere uma imagem onde uma menina esteja lendo um livro, com uma pose semelhante à do menino de uma determinada imagem de exemplo. A IA deverá, então, acessar o modelo específico para determinar a pose do menino na imagem original, usar outro modelo para criar uma nova imagem adaptada com uma menina, traduzir essa imagem em texto e, finalmente, utilizar um modelo texto-voz para descrever a nova imagem criada.

O quarto e último padrão são os sistemas multiagentes. Neste padrão, em vez de utilizar um único modelo de linguagem grande para executar uma tarefa completa, diferentes modelos são empregados para realizar tarefas específicas em colaboração. Uma pergunta frequente que surge é: por que não utilizar apenas uma única IA para realizar todas as tarefas? A resposta está na analogia com equipes humanas. Da mesma forma que um projeto realizado por uma equipe composta por especialistas de diferentes áreas tende a ser mais eficiente e produzir melhores resultados do que aquele realizado por uma única pessoa, sistemas multiagentes também têm se mostrado mais eficazes. Pesquisas comprovam que fluxos de trabalho multiagentes frequentemente resultam em produtos finais superiores àqueles obtidos quando um único agente realiza todas as atividades sozinho.

Para lembrar facilmente esses quatro padrões (reflexão, uso de ferramentas, planejamento e sistemas multiagentes), sugiro o uso da mnemônica: "tartarugas vermelhas pintando murais". Essa técnica será útil na pequena avaliação ao final do vídeo.

Para tornar esses conceitos mais concretos, vejamos exemplos interessantes do uso prático desses padrões. Imagine uma ferramenta com um fluxo integrado de agente que permite capturar uma imagem de um jogo de futebol e identificar e contar automaticamente o número de jogadores em campo. Outra aplicação interessante seria em vídeos, solicitando que um agente divida automaticamente o vídeo em clipes de cinco segundos, identifique o trecho exato onde ocorre um gol e exiba os frames correspondentes ao momento exato do gol. Esses exemplos demonstram como a IA pode transformar radicalmente o aproveitamento de grandes volumes de dados audiovisuais, atualmente pouco explorados.

Outros exemplos práticos de sistemas multiagentes incluem assistentes de pesquisa capazes de analisar tópicos específicos, escritores virtuais que podem redigir conteúdos sobre esses tópicos, agentes programadores capazes de criar softwares e assistentes pessoais—este último exemplo, inclusive, será demonstrado detalhadamente mais à frente neste vídeo.

Como fica evidente, os agentes de IA e os fluxos de trabalho baseados nesses agentes possuem um forte componente de engenharia de prompt. Isso reforça a importância desta habilidade, que oferece um retorno sobre investimento muito alto em termos de produtividade.

Caso esteja interessado em aprimorar suas habilidades em engenharia de prompt, recomendo um guia rápido e gratuito que preparei em parceria com a HubSpot. Este guia apresenta passo a passo a construção de prompts eficazes e dicas importantes para melhorar significativamente seus resultados. A melhor parte é que, para cada exemplo, o guia mostra uma progressão clara de um prompt ruim, para um aceitável e, finalmente, um prompt excelente, ilustrando como se pode melhorar cada etapa. Se você seguir esse processo, certamente aumentará sua produtividade e conseguirá aproveitar ainda mais os recursos da IA. Caso esteja interessado, o link para acessar esse guia está disponível na descrição.

Agradeço especialmente à HubSpot pela colaboração na criação deste recurso gratuito e pelo patrocínio desta parte do vídeo.

Na sequência, abordaremos rapidamente os padrões de design multiagentes, que atualmente estão recebendo grande atenção devido aos avanços interessantes nessa área. Para isso, realizei alguns cursos e o melhor que encontrei sobre este assunto específico foi o da Crew AI, realizado em colaboração com a Deep Learning AI. Esse curso oferece uma introdução bastante completa aos diversos tipos de padrões de design multiagentes.

O primeiro conceito fundamental a entender é a estrutura básica de um único agente de IA, que consiste em quatro componentes essenciais: tarefa, resposta desejada, modelo utilizado e ferramentas disponíveis. Para memorizar esses elementos, pode-se utilizar outra mnemônica simples: "a mistura de alpacas cansadas" (Tarefa, Resposta, Modelo, Ferramentas).

Para ilustrar rapidamente, pense em um agente de planejamento de viagens. Sua tarefa pode ser planejar uma viagem de três dias para Tóquio com orçamento limitado. A resposta desejada seria uma programação detalhada contendo locais, custos, reservas de hotéis e ingressos necessários. O modelo de IA poderia ser o Claude da Anthropic (apesar de outros modelos poderem ser utilizados) e as ferramentas seriam plataformas como Skyscanner, Booking.com e informações de cartão de crédito para reservas práticas.


Após entender os fundamentos de um agente individual, a estrutura multiagente mais simples seria composta por apenas dois agentes colaborando em uma tarefa comum. Cada agente possui suas próprias atribuições, mas trabalham juntos em objetivos compartilhados. Por exemplo, pode-se pensar em um agente que atua como escritor, encarregado de redigir um artigo para um blog, e outro que atua como editor, oferecendo feedback constante ao escritor.

Mesmo com apenas dois agentes, surgem aspectos interessantes. Cada agente pode ter sua própria tarefa específica, enquanto simultaneamente colabora com o outro em tarefas compartilhadas. Outro ponto relevante é que, quanto às ferramentas, cada agente pode possuir ferramentas exclusivas, mas é possível também atribuir uma ferramenta específica diretamente a uma tarefa, de modo que apenas o agente encarregado dessa tarefa possa acessá-la.

Quando se inclui mais de um agente no sistema, obtém-se uma equipe de agentes (conhecida como "Equipe IA"). À medida que se acrescentam novos agentes ao grupo, a complexidade e a interação entre eles aumentam exponencialmente. As possibilidades são imensas e poderíamos passar horas discutindo as diversas configurações de equipes multiagentes e as ferramentas envolvidas. Felizmente, o curso mencionado fornece uma visão abrangente dos diferentes padrões de design mais utilizados e eficazes.

O primeiro desses padrões de design é o padrão sequencial, o mais simples. Nele, um agente realiza uma tarefa específica e então passa o resultado adiante para o próximo agente, que realiza outra etapa, e assim sucessivamente, lembrando uma linha de montagem. Por exemplo, em um sistema de processamento de documentos assistido por IA, o primeiro agente poderia extrair texto de documentos digitalizados, repassá-lo ao segundo agente para que ele faça um resumo, o qual, por sua vez, encaminha o conteúdo para um terceiro agente responsável por extrair itens importantes e transformá-los em uma lista de ações. Por fim, um quarto agente poderia inserir essas informações em um banco de dados.

O segundo padrão é o padrão hierárquico, mais complexo. Nesse modelo, existe um agente principal (gerente ou líder) supervisionando diversos subagentes, cada um com tarefas específicas. Esses subagentes executam suas atividades individualmente e reportam os resultados ao agente principal, que agrega todas as informações. Um exemplo prático seria a elaboração de relatórios para tomadas de decisões empresariais. O agente gerente atribuiria tarefas específicas a cada subagente: o primeiro monitoraria tendências de mercado, o segundo analisaria dados internos de satisfação dos clientes e o terceiro acompanharia métricas internas da empresa. Após finalizar as tarefas, todos os subagentes reportariam os resultados ao agente principal, que então os reuniria e possivelmente os encaminharia para outro agente, dedicado à tomada de decisões estratégicas.

Em terceiro lugar, temos o sistema híbrido, que combina as estruturas sequenciais e hierárquicas. Nele, agentes interagem em diferentes níveis e direções, tanto verticalmente (de cima para baixo ou vice-versa), quanto horizontalmente (sequencialmente). Um exemplo disso são veículos autônomos. O agente principal seria responsável pelo planejamento global de rotas e estratégias gerais de tráfego, enquanto os subagentes cuidariam de funções específicas, como prevenção de colisões, fusão de dados de sensores em tempo real e análise das condições das vias. Contudo, não basta somente agregar as informações e enviá-las ao agente principal. É necessário criar ciclos constantes de retroalimentação (feedback), pois as condições ao redor do veículo mudam continuamente, demandando interações frequentes entre subagentes e o agente principal. Esse modelo híbrido é muito comum em sistemas de navegação robótica e sistemas de IA adaptáveis, especialmente onde existem múltiplas variáveis em constante alteração.

O quarto padrão mencionado é o padrão paralelo. Aqui, diferentes agentes trabalham simultaneamente em tarefas distintas, com o objetivo de acelerar processos ou lidar com grandes volumes de dados. Um exemplo clássico é a análise de dados em larga escala. Nesse modelo, cada agente assume uma parte dos dados, realizando análises independentes. Ao final, os resultados produzidos por todos os agentes são combinados em um único relatório integrado.

O quinto padrão, mais avançado, é o multiagente assíncrono. Nesse sistema, cada agente realiza tarefas de forma independente e em momentos diferentes, frequentemente utilizados em ambientes incertos ou dinâmicos. Um exemplo prático seria a detecção de ameaças em segurança cibernética, onde um agente monitora o tráfego de rede em tempo real, outro observa padrões suspeitos de uso, enquanto um terceiro executa testes aleatórios de segurança. Caso algum deles detecte algo anormal, imediatamente sinaliza aos demais agentes ou ao sistema central. Essa estrutura é particularmente eficiente em sistemas que exigem monitoramento constante e respostas rápidas.

Finalmente, é possível integrar diversos desses padrões em uma configuração complexa, denominada fluxo híbrido composto. Essa abordagem gera resultados ainda mais sofisticados, porém, ao mesmo tempo, aumenta significativamente o nível de complexidade, tornando o sistema mais difícil de gerenciar. Quanto maior a complexidade, maior a necessidade de controle sobre a interação dos agentes, pois cada adição de novos elementos aumenta o potencial de caos no sistema. Nesse sentido, é válido fazer uma comparação com empresas humanas, que à medida que crescem também enfrentam desafios semelhantes, exigindo estruturas organizacionais mais sólidas e bem planejadas. Embora não haja certeza absoluta, é provável que muitos conceitos estudados em organizações humanas também possam ser aplicados, com adaptações, na gestão de sistemas complexos de IA.

No restante do curso original são apresentados diversos exemplos práticos e implementações concretas desses sistemas multiagentes. Para evitar detalhamentos excessivos, disponibilizarei na descrição deste vídeo links para alguns notebooks que permitem implementar esses sistemas utilizando código com a ferramenta Crew AI. Entretanto, não se preocupe caso você não tenha interesse ou habilidade em programação, pois a seguir será apresentada uma alternativa prática, completamente sem código, para construir sistemas multiagentes utilizando a ferramenta de automação chamada n8n.

Estou particularmente satisfeito por termos testado este novo dispositivo de construção automatizada, que é significativamente mais eficiente do que outras ferramentas mais antigas, como make.com. Essa abordagem sem código será demonstrada detalhadamente no próximo segmento deste vídeo.



Para demonstrar a praticidade dessas ferramentas sem código, segui um excelente tutorial do especialista David Andre, adaptando-o para criar meu próprio assistente de IA baseado no Telegram. Esse assistente é capaz de interagir diretamente com o usuário, ajudando-o a priorizar tarefas, acessando o Google Agenda e criando eventos automaticamente.

Por exemplo, utilizando o Telegram, posso perguntar ao meu assistente pessoal (chamado de "bot Inky") quais são minhas tarefas de hoje. O bot então consulta o calendário e responde que hoje, dia 5 de fevereiro de 2025, tenho agendada uma gravação de vídeo das 12:00 às 16:00 em Hong Kong. Além disso, o assistente me pede que informe outras tarefas ou prioridades para aquele dia, ajudando-me a criar uma lista organizada. Eu poderia, por exemplo, informar que a gravação é minha prioridade máxima e listar outras tarefas secundárias. O assistente, então, seria capaz não apenas de criar uma sequência lógica dessas tarefas, mas também de agendar eventos correspondentes diretamente no Google Agenda.

De forma resumida, o fluxo de funcionamento desse assistente ocorre da seguinte maneira: primeiramente, temos o acionamento do bot pelo Telegram assim que uma mensagem é enviada ao Inky. Em seguida, há uma bifurcação ("switch"), já que o assistente pode receber tanto mensagens escritas quanto mensagens de voz. Se a mensagem for escrita, o conteúdo é diretamente processado pelo agente de IA. Caso seja em formato de voz, o arquivo é inicialmente transcrito utilizando uma ferramenta específica integrada ao OpenAI, e somente após a transcrição o conteúdo textual segue para o agente de IA.

Neste ponto entra o componente interessante do fluxo: o agente de IA. Lembre-se novamente da mnemônica "a mistura de alpacas cansadas" (Tarefa, Resposta, Modelo, Ferramentas). A tarefa do agente é identificar as ações necessárias para o dia atual; a resposta desejada é a criação de uma lista priorizada de tarefas com eventos específicos programados no Google Agenda. Quanto ao modelo utilizado, pode-se optar pelo GPT-4 da OpenAI, embora seja possível usar outros modelos, como Claude, Gemini, Llama ou DeepSeek. Por fim, temos as ferramentas disponíveis, sendo duas nesse caso: uma ferramenta para consultar eventos existentes no Google Agenda e outra para criar novos eventos no calendário.

Após processar essas informações, o assistente retorna ao Telegram e interage continuamente com o usuário, até gerar uma lista de tarefas satisfatória. Também pode realizar ações adicionais, como marcar tarefas concluídas, planejar antecipadamente ou revisar eventos passados. Embora o fluxo descrito acima seja relativamente simples e envolva apenas um agente principal, já é possível alcançar resultados impressionantes. Imagine, portanto, o que poderia ser realizado ao incorporar outros agentes ou funcionalidades adicionais a essa estrutura.

Finalmente, vamos falar sobre as oportunidades práticas e comerciais oferecidas pelos agentes de IA. Ao pesquisar exaustivamente em diversos vídeos e artigos sobre esse tema, encontrei uma orientação extremamente valiosa em um vídeo do Y Combinator. Nele é afirmado algo impactante e de grande relevância estratégica: "Para cada empresa SaaS (Software como Serviço) que existe atualmente, haverá uma versão correspondente em formato de agentes de IA". Vale destacar a profundidade dessa afirmação, pois ela sugere uma enorme quantidade de oportunidades para quem deseja desenvolver novos produtos ou negócios nessa área.

Portanto, se você não sabe exatamente por onde começar ou deseja experimentar algo novo utilizando agentes de IA, um excelente ponto de partida é observar empresas SaaS existentes e imaginar como transformá-las em soluções baseadas em agentes de inteligência artificial. Caso precise de sugestões de empresas SaaS, pergunte diretamente ao ChatGPT, que poderá listar exemplos populares, como Adobe, Microsoft, Salesforce, Shopify, Linktree, Canva ou Squarespace. Literalmente, todas as empresas atualmente consideradas unicórnios podem ter um equivalente em forma de agente de IA, abrindo assim um vasto campo de possibilidades.

Particularmente, acredito que essa sugestão possui um valor extraordinário. Inclusive, gostaria muito que você comentasse qual agente específico ou modelo de negócio baseado em IA gostaria de criar ou explorar futuramente.

Chegamos ao final deste vídeo. Muito obrigado por acompanhar este conteúdo até aqui. Aproveito também para pedir que compartilhe nos comentários outros temas relacionados ou não à inteligência artificial que gostaria que eu aprofundasse futuramente."


Última modificación: Tuesday, 1 de July de 2025, 15:56