📖 Literatura 👓 Introdução 👓 MiniMax 👓 Monte Carlo ✏️ Galo MiniMax ✏️ Galo alfa/beta 💻 Jogo do Galo 💻 Jogo em Linha

⚡ Ação: O que distingue um ambiente multiagente de um ambiente uni‑agente?

👉 Num ambiente multiagente existem vários agentes a atuar, cada um com os seus próprios objetivos, e as ações de um influenciam o resultado dos outros. Num ambiente uni‑agente, o agente interage apenas com o ambiente, sem adversários nem colaboradores.

⚡ Ação: Porque é que tratar os outros agentes como “acaso” pode degradar a performance?

👉 Porque esta simplificação ignora que os outros agentes também tentam maximizar a sua utilidade. Assumi‑los como aleatórios leva a decisões subótimas, já que o agente não antecipa ações adversas intencionais.

⚡ Ação: O que significa um jogo ser de soma nula?

👉 Significa que a soma das utilidades dos jogadores é constante: o ganho de um corresponde exatamente à perda do outro. Se um vence, o outro perde.

⚡ Ação: Porque é que jogos como dominó ou cartas são considerados jogos de soma nula, mas não são determinísticos?

👉 Porque o resultado depende tanto das ações dos jogadores como de elementos aleatórios, como a distribuição das peças ou cartas. A soma das utilidades continua constante, mas o ambiente deixa de ser determinístico.

⚡ Ação: O que caracteriza um jogo parcialmente observável?

👉 Cada jogador conhece apenas parte do estado do jogo. Por exemplo, nas cartas ou dominó, cada jogador vê apenas as suas peças, não as dos adversários.

⚡ Ação: Porque é que a presença de aleatoriedade altera o tipo de procura necessária?

👉 Porque o agente deixa de poder prever exatamente o resultado das ações. Em vez de um único estado sucessor, existem distribuições de probabilidade, exigindo algoritmos que lidem com incerteza.

⚡ Ação: Dá um exemplo de situação multiagente episódica.

👉 Um concurso em que cada agente apresenta uma proposta numa única ronda. Não há sequência de ações, mas continua a existir competição entre agentes.

⚡ Ação: Porque é que jogos dinâmicos e contínuos são difíceis para IA clássica?

👉 Porque o estado muda continuamente enquanto o agente delibera, e o espaço de estados é infinito ou muito grande, dificultando a modelação e a procura exaustiva.

⚡ Ação: No jogo do galo, como se determina quem joga numa dada posição?

👉 Contando o número de marcas no tabuleiro: se X e O têm o mesmo número de marcas, joga X; caso contrário, joga O.

⚡ Ação: No jogo do galo, o que define uma ação válida?

👉 Uma ação é válida se a posição (linha, coluna) escolhida estiver vazia. Caso contrário, a ação leva ao estado impossível.

⚡ Ação: O que acontece quando se tenta aplicar uma ação inválida?

👉 O modelo de transição devolve o estado impossível, indicando que a ação não pode ser aplicada ao estado atual.

⚡ Ação: Quais são as duas condições que determinam o fim do jogo do galo?

👉 O jogo termina quando não há casas vazias ou quando existe uma linha, coluna ou diagonal com três marcas iguais.

⚡ Ação: Como é atribuída a utilidade num jogo de soma nula como o jogo do galo?

👉 Vitória → utilidade 1 para o vencedor e 0 para o perdedor. Empate → utilidade igual para ambos, tipicamente 0.5.

⚡ Ação: Porque é que o espaço de estados do jogo do galo inclui posições impossíveis?

👉 Porque a definição matemática permite qualquer combinação de marcas, mesmo que não possa ser atingida seguindo as regras (por exemplo, dois X seguidos sem O).

⚡ Ação: Como se obtêm os sucessores de um estado?

👉 Aplicando todas as ações válidas ao estado atual através do modelo de transição.

⚡ Ação: O que distingue uma árvore de jogo de uma árvore de procura normal?

👉 Numa árvore de jogo, cada nível corresponde a um jogador diferente, alternando entre agentes adversos. Numa procura normal, todas as ações pertencem ao mesmo agente.

⚡ Ação: Porque é que se eliminam simetrias na árvore de jogo?

👉 Para reduzir o número de estados equivalentes, evitando analisar posições que são iguais por rotação ou reflexão, tornando a procura mais eficiente.

⚡ Ação: Porque é que o X tem apenas 3 ações distintas no primeiro movimento?

👉 Porque todas as 9 posições possíveis são simétricas entre si, reduzindo-se a 3 classes equivalentes: canto, centro e lateral.

⚡ Ação: Porque é que a alternância de jogadores é essencial na procura adversa?

👉 Porque cada jogador tenta maximizar a sua utilidade, e a decisão ótima depende das ações futuras do adversário, não apenas das próprias.

⚡ Ação: Porque é que raramente é possível analisar toda a árvore de jogo?

👉 Porque o número de estados cresce exponencialmente com a profundidade, tornando inviável explorar todas as possibilidades num jogo realista.

⚡ Ação: Porque é que a análise individual de cada agente é impraticável quando o número de agentes é muito elevado?

👉 Porque o número de combinações possíveis de ações cresce de forma explosiva, tornando impossível modelar ou prever o comportamento de cada agente isoladamente. Nestes casos, só é viável analisar efeitos globais, como acontece na economia.

⚡ Ação: Em que situação pode ser aceitável tratar outros agentes como aleatórios?

👉 Quando o comportamento dos outros agentes é imprevisível ou irrelevante para o objetivo principal, e a perda de precisão não compromete significativamente a performance do agente.

⚡ Ação: O que caracteriza um ambiente adverso em termos de objetivos dos agentes?

👉 Os agentes têm objetivos incompatíveis: maximizar o ganho próprio implica reduzir o ganho do adversário. Cada ação é tomada antecipando a resposta do outro.

⚡ Ação: Porque é que jogos parcialmente observáveis são mais difíceis para IA?

👉 Porque o agente não tem acesso ao estado completo do ambiente, sendo obrigado a raciocinar sobre estados possíveis, incerteza e informação oculta.

⚡ Ação: Porque é que puzzles não requerem procura adversa?

👉 Porque não existe adversário. O agente controla todas as ações e o ambiente não reage com objetivos próprios.

⚡ Ação: Como se representa formalmente o estado inicial do jogo do galo?

👉 Como uma função que associa a cada posição da grelha 3×3 o valor “vazio”.

⚡ Ação: Porque é que a função jog(s) depende apenas da contagem de marcas?

👉 Porque a alternância entre X e O é determinada unicamente pelo número de jogadas já feitas, dispensando regras adicionais.

⚡ Ação: Porque é útil ter um estado “impossível” no modelo de transição?

👉 Para representar formalmente ações que violam as regras, permitindo que o algoritmo trate erros de forma consistente.

⚡ Ação: Porque é que o teste de fim de jogo pode exigir funções auxiliares?

👉 Porque verificar condições como “três em linha” ou “não há casas vazias” pode exigir percorrer o tabuleiro ou verificar padrões específicos.

⚡ Ação: Porque é que a utilidade pode não ser de soma constante?

👉 Porque em muitos jogos ou cenários multiagente, o ganho de um jogador não implica necessariamente a perda proporcional do outro.

⚡ Ação: Porque é que o espaço de estados inclui posições que nunca ocorrem num jogo real?

👉 Porque a definição matemática é genérica e não impõe restrições sobre a ordem das jogadas, permitindo combinações impossíveis como dois X seguidos.

⚡ Ação: Qual a relação entre ações possíveis e sucessores?

👉 Cada sucessor corresponde ao resultado de aplicar uma ação válida ao estado atual. A lista de sucessores é derivada diretamente das ações.

⚡ Ação: Porque é que a alternância de jogadores torna a árvore de jogo diferente da árvore de procura clássica?

👉 Porque cada nível da árvore corresponde a um agente distinto, com objetivos diferentes, o que altera a forma como os valores são propagados.

⚡ Ação: Qual é a vantagem de eliminar estados simétricos?

👉 Reduz drasticamente o número de estados a analisar, sem perder informação relevante, tornando a procura mais eficiente.

⚡ Ação: Porque é que o jogador O tem 5 jogadas distintas após X jogar num canto?

👉 Porque várias respostas possíveis são simétricas entre si, restando apenas 5 posições realmente diferentes.

⚡ Ação: Porque é que o algoritmo de procura adversa é independente do jogo?

👉 Porque opera sobre estados abstratos e funções genéricas (jog, ações, utilidade), não dependendo das regras específicas do jogo.

⚡ Ação: Porque é que a utilidade é essencial na procura adversa?

👉 Porque permite avaliar estados terminais e orientar a escolha de ações que maximizam o resultado esperado para o agente.

⚡ Ação: Como a informação oculta afeta a estratégia num jogo?

👉 O agente deve considerar múltiplos estados possíveis, aumentando a incerteza e exigindo raciocínio probabilístico.

📄 Ver slides (PDF)

Nova pergunta: 🎲

◀ Passo anterior Próximo passo ▶