⚡ Ação: O que distingue um ambiente multiagente de um ambiente uni‑agente?
👉 Num ambiente multiagente existem vários agentes a atuar, cada um com os seus próprios objetivos, e as ações de um influenciam o resultado dos outros.
Num ambiente uni‑agente, o agente interage apenas com o ambiente, sem adversários nem colaboradores.
⚡ Ação: Porque é que tratar os outros agentes como “acaso” pode degradar a performance?
👉 Porque esta simplificação ignora que os outros agentes também tentam maximizar a sua utilidade.
Assumi‑los como aleatórios leva a decisões subótimas, já que o agente não antecipa ações adversas intencionais.
⚡ Ação: O que significa um jogo ser de soma nula?
👉 Significa que a soma das utilidades dos jogadores é constante: o ganho de um corresponde exatamente à perda do outro.
Se um vence, o outro perde.
⚡ Ação: Porque é que jogos como dominó ou cartas são considerados jogos de soma nula, mas não são determinísticos?
👉 Porque o resultado depende tanto das ações dos jogadores como de elementos aleatórios, como a distribuição das peças ou cartas.
A soma das utilidades continua constante, mas o ambiente deixa de ser determinístico.
⚡ Ação: O que caracteriza um jogo parcialmente observável?
👉 Cada jogador conhece apenas parte do estado do jogo.
Por exemplo, nas cartas ou dominó, cada jogador vê apenas as suas peças, não as dos adversários.
⚡ Ação: Porque é que a presença de aleatoriedade altera o tipo de procura necessária?
👉 Porque o agente deixa de poder prever exatamente o resultado das ações.
Em vez de um único estado sucessor, existem distribuições de probabilidade, exigindo algoritmos que lidem com incerteza.
⚡ Ação: Dá um exemplo de situação multiagente episódica.
👉 Um concurso em que cada agente apresenta uma proposta numa única ronda.
Não há sequência de ações, mas continua a existir competição entre agentes.
⚡ Ação: Porque é que jogos dinâmicos e contínuos são difíceis para IA clássica?
👉 Porque o estado muda continuamente enquanto o agente delibera, e o espaço de estados é infinito ou muito grande,
dificultando a modelação e a procura exaustiva.
⚡ Ação: No jogo do galo, como se determina quem joga numa dada posição?
👉 Contando o número de marcas no tabuleiro: se X e O têm o mesmo número de marcas, joga X; caso contrário, joga O.
⚡ Ação: No jogo do galo, o que define uma ação válida?
👉 Uma ação é válida se a posição (linha, coluna) escolhida estiver vazia. Caso contrário, a ação leva ao estado impossível.
⚡ Ação: O que acontece quando se tenta aplicar uma ação inválida?
👉 O modelo de transição devolve o estado impossível, indicando que a ação não pode ser aplicada ao estado atual.
⚡ Ação: Quais são as duas condições que determinam o fim do jogo do galo?
👉 O jogo termina quando não há casas vazias ou quando existe uma linha, coluna ou diagonal com três marcas iguais.
⚡ Ação: Como é atribuída a utilidade num jogo de soma nula como o jogo do galo?
👉 Vitória → utilidade 1 para o vencedor e 0 para o perdedor.
Empate → utilidade igual para ambos, tipicamente 0.5.
⚡ Ação: Porque é que o espaço de estados do jogo do galo inclui posições impossíveis?
👉 Porque a definição matemática permite qualquer combinação de marcas, mesmo que não possa ser atingida seguindo as regras (por exemplo, dois X seguidos sem O).
⚡ Ação: Como se obtêm os sucessores de um estado?
👉 Aplicando todas as ações válidas ao estado atual através do modelo de transição.
⚡ Ação: O que distingue uma árvore de jogo de uma árvore de procura normal?
👉 Numa árvore de jogo, cada nível corresponde a um jogador diferente, alternando entre agentes adversos.
Numa procura normal, todas as ações pertencem ao mesmo agente.
⚡ Ação: Porque é que se eliminam simetrias na árvore de jogo?
👉 Para reduzir o número de estados equivalentes, evitando analisar posições que são iguais por rotação ou reflexão,
tornando a procura mais eficiente.
⚡ Ação: Porque é que o X tem apenas 3 ações distintas no primeiro movimento?
👉 Porque todas as 9 posições possíveis são simétricas entre si, reduzindo-se a 3 classes equivalentes: canto, centro e lateral.
⚡ Ação: Porque é que a alternância de jogadores é essencial na procura adversa?
👉 Porque cada jogador tenta maximizar a sua utilidade, e a decisão ótima depende das ações futuras do adversário,
não apenas das próprias.
⚡ Ação: Porque é que raramente é possível analisar toda a árvore de jogo?
👉 Porque o número de estados cresce exponencialmente com a profundidade,
tornando inviável explorar todas as possibilidades num jogo realista.
⚡ Ação: Porque é que a análise individual de cada agente é impraticável quando o número de agentes é muito elevado?
👉 Porque o número de combinações possíveis de ações cresce de forma explosiva, tornando impossível modelar ou prever o comportamento de cada agente isoladamente. Nestes casos, só é viável analisar efeitos globais, como acontece na economia.
⚡ Ação: Em que situação pode ser aceitável tratar outros agentes como aleatórios?
👉 Quando o comportamento dos outros agentes é imprevisível ou irrelevante para o objetivo principal, e a perda de precisão não compromete significativamente a performance do agente.
⚡ Ação: O que caracteriza um ambiente adverso em termos de objetivos dos agentes?
👉 Os agentes têm objetivos incompatíveis: maximizar o ganho próprio implica reduzir o ganho do adversário. Cada ação é tomada antecipando a resposta do outro.
⚡ Ação: Porque é que jogos parcialmente observáveis são mais difíceis para IA?
👉 Porque o agente não tem acesso ao estado completo do ambiente, sendo obrigado a raciocinar sobre estados possíveis, incerteza e informação oculta.
⚡ Ação: Porque é que puzzles não requerem procura adversa?
👉 Porque não existe adversário. O agente controla todas as ações e o ambiente não reage com objetivos próprios.
⚡ Ação: Como se representa formalmente o estado inicial do jogo do galo?
👉 Como uma função que associa a cada posição da grelha 3×3 o valor “vazio”.
⚡ Ação: Porque é que a função jog(s) depende apenas da contagem de marcas?
👉 Porque a alternância entre X e O é determinada unicamente pelo número de jogadas já feitas, dispensando regras adicionais.
⚡ Ação: Porque é útil ter um estado “impossível” no modelo de transição?
👉 Para representar formalmente ações que violam as regras, permitindo que o algoritmo trate erros de forma consistente.
⚡ Ação: Porque é que o teste de fim de jogo pode exigir funções auxiliares?
👉 Porque verificar condições como “três em linha” ou “não há casas vazias” pode exigir percorrer o tabuleiro ou verificar padrões específicos.
⚡ Ação: Porque é que a utilidade pode não ser de soma constante?
👉 Porque em muitos jogos ou cenários multiagente, o ganho de um jogador não implica necessariamente a perda proporcional do outro.
⚡ Ação: Porque é que o espaço de estados inclui posições que nunca ocorrem num jogo real?
👉 Porque a definição matemática é genérica e não impõe restrições sobre a ordem das jogadas, permitindo combinações impossíveis como dois X seguidos.
⚡ Ação: Qual a relação entre ações possíveis e sucessores?
👉 Cada sucessor corresponde ao resultado de aplicar uma ação válida ao estado atual. A lista de sucessores é derivada diretamente das ações.
⚡ Ação: Porque é que a alternância de jogadores torna a árvore de jogo diferente da árvore de procura clássica?
👉 Porque cada nível da árvore corresponde a um agente distinto, com objetivos diferentes, o que altera a forma como os valores são propagados.
⚡ Ação: Qual é a vantagem de eliminar estados simétricos?
👉 Reduz drasticamente o número de estados a analisar, sem perder informação relevante, tornando a procura mais eficiente.
⚡ Ação: Porque é que o jogador O tem 5 jogadas distintas após X jogar num canto?
👉 Porque várias respostas possíveis são simétricas entre si, restando apenas 5 posições realmente diferentes.
⚡ Ação: Porque é que o algoritmo de procura adversa é independente do jogo?
👉 Porque opera sobre estados abstratos e funções genéricas (jog, ações, utilidade), não dependendo das regras específicas do jogo.
⚡ Ação: Porque é que a utilidade é essencial na procura adversa?
👉 Porque permite avaliar estados terminais e orientar a escolha de ações que maximizam o resultado esperado para o agente.
⚡ Ação: Como a informação oculta afeta a estratégia num jogo?
👉 O agente deve considerar múltiplos estados possíveis, aumentando a incerteza e exigindo raciocínio probabilístico.
📄 Ver slides (PDF)
Nova pergunta: 🎲