Home Sobre Metodologia LAI Exemplo: Fundo Amazônia

  1. Conferência das Partes
  2. Coleta de dados
  3. Pré-processamento e limpeza de dados
  4. Seleção, classificação e codificação de tópicos
  5. Limitações e passos futuros
  6. Referências

1. Conferência das Partes

As Conferências das Partes (COP) são as convenções organizadas pela Convenção-Quadro das Nações Unidas sobre as Alterações Climáticas (UNFCCC, na sigla em inglês). A COP pode ser definida como “uma reunião de condomínio com 196 pessoas, que precisam decidir sobre uma obra de grandes dimensões no prédio”, segundo a LACLIMA e o Observatório do Clima em seu ótimo Guia para os perplexos, sobre o Acordo de Paris. Outras convenções internacionais foram surgindo ao longo do tempo, como a COP da Biodiversidade.

Neste projeto, quando não houver indicação explícita, estamos nos referindo sempre às COP Climáticas ou COP do Clima, que começaram a ocorrer anualmente em 1995. Essas COP são o espaço de deliberação e negociação climática de maior importância globalmente. Durante duas semanas se reúnem 195 países mais a União Europeia, representantes da sociedade civil, jornalistas, delegações nacionais, ativistas, lobistas e propagandistas para, idealmente, discutir e negociar acordos políticos para enfrentar e mitigar os efeitos das mudanças climáticas causadas pelas emissões de gases do efeito estufa.

Importantes acordos internacionais como o Protocolo de Quioto (1997) e o Acordo de Paris (2015) foram estabelecidos após anos de negociações no âmbito das COP e outras convenções climáticas. A importância de seu papel na articulação de acordos e soluções para mitigar as mudanças climáticas é significativa — é um dos poucos espaços globais em que países sem poder político relevante globalmente obtêm o mesmo espaço de representatividade —, mesmo que existam críticas à sua efetividade, ao modelo deliberativo e à sua organização.

O segmento de alto nível das COPs são seções curtas que acontecem durante as duas semanas do período do evento, normalmente ao final, nas quais cada país tem oportunidade de fazer uma declaração, que costuma ser feita pelo/as ministro/as ou presidente/as. De forma geral, é neste espaço que estes representantes apresentam os resultados das ações executadas para mitigar as mudanças climáticas.

É aí, também, que apresentam os planos futuros, e a posição oficial sobre tópicos previamente definidos para serem levados à mesa de negociação. Estas declarações são redigidas e pensadas considerando tanto o contexto do evento e as pautas em negociação, quanto a recepção dos eleitores de sua própria nação.

Assim, entendemos que as declarações realizadas no alto nível são ferramentas complexas e multifacetadas de negociação e diplomacia. Elas não só representam posições individuais por parte dos estados-nações, mas, em alguns casos, também refletem relações articuladas dentro dos diferentes grupos de trabalho e blocos de negociação existentes nas COPs.

Embora a posição de um país sobre as diversas questões climáticas globais não possa ser discernida puramente a partir de declarações oficiais, a análise desses textos —não só dos discursos, mas da numerosa documentação submetida pelas partes — confere uma série de vantagens. Uma delas é que os documentos compartilham um formato padrão, garantindo comparações relevantes entre os países, assim como um marco comparativo estável.

Além disso, os documentos funcionam como mapas que revelam as prioridades e posições nacionais. No nosso caso, acreditamos que uso exclusivo de discursos e declarações no alto nível das COPs não permite realizar um estudo sistemático das posições ambientais nacionais, mas acreditamos que estas declarações permitem enxergar elementos da política ambiental nacional, mesmo que de forma parcial.

2. Coleta de dados

Após ter definido o objeto da pesquisa — transcrição em texto de discursos e declarações do governo brasileiro, em português, feitas no segmento de alto nível e na sessão plenária das COPs —, nosso primeiro passo foi sistematizar a coleta dos dados. Para isso, organizamos a busca em quatro procedimentos:

Os três primeiros procedimentos de busca foram realizados de forma simultânea de maio a agosto de 2022. Achamos 13 discursos, de um total de 27. Em alguns casos encontramos links quebrados (sem acesso no servidor) e versões recortadas ou incompletas em clippings de assessorias dos ministérios e veículos jornalísticos. Com relação à pesquisa feita nos sites oficiais dos ministérios envolvidos na representação nacional nas COP, alguns dos documentos achados inicialmente tiveram acesso limitado a partir do mês de setembro por causa do período eleitoral no Brasil:

banner informativo que menciona a disponibilidade de informação durante o período eleitoral
Imagem #1 — Banner informativo que menciona a disponibilidade de informação durante o período eleitoral.

Já no site oficial da UNFCCC, tanto o repositório digital Submissions and statements, quanto os sites oficiais das diferentes COPs, nos deparamos com a falta de registros dos governos brasileiros. Dois pontos são importantes para se destacar:

A procura pelos registros via Lei de Acesso à Informação (LAI) começou também em maio. Os prazos de resposta e recursos variam muito neste tipo de mecanismo de modo que alguns desses pedidos ainda estão em andamento — se você quiser saber mais, entre na aba LAI para ler um relato completo sobre o processo.

Os pedidos feitos pela LAI trouxeram informações variadas até o momento de publicação do projeto: em alguns casos, recebemos declarações de membros da delegação do governo brasileiro feitas em outras sessões, fora dos segmentos de alto nível e da plenária geral. Em outros, discursos repetidos (achados nos sites dos ministérios) ou relatórios sobre os diversos grupos de trabalho dentro das COPs.

3. Pré-processamento e limpeza de dados

Após a coleta dos dados, realizamos o pré-processamento e limpeza dos mesmos, o que incluiu as seguintes ações:

Para garantir o acesso e a disponibilidade dos dados coletados, salvamos cópias de todos os discursos tanto de forma local (nos computadores dos membros da equipe) quanto em repositórios digitais abertos, especificamente, no Internet Archive e Perma.cc, os quais permitem criar um link estável aos conteúdos originais. Posteriormente criamos um repositório no GitHub, para centralizar os arquivos individuais, assim como o corpus único. O repositório foi nosso espaço de trabalho coletivo ao longo do processo. Atualmente, o repositório contém:

4. Seleção, classificação e codificação de tópicos

A categorização dos tópicos foi realizada de forma manual e faz parte de uma metodologia complementar baseada em processos de identificação, edição e seleção:

  1. Leitura do corpus
  2. Leitura e codificação manual de tópicos
  3. Modelagem de tópicos em Voyant Tools
  4. Categorização inicial
  5. Revisão de tópicos centrais da UNFCCC
  6. Definição de pautas jornalísticas relevantes
  7. Revisão de literatura acadêmica
  8. Leitura, classificação e codificação final

Iniciamos o processo com uma leitura individual da totalidade do corpus, para nos familiarizar com seu conteúdo e identificar possíveis tópicos e subtextos relevantes. Na segunda fase, cada membro da equipe leu os discursos de novo e construiu uma lista inicial de tópicos, assim como uma seleção e marcação dos trechos que compunham os diferentes tópicos achados nos discursos. A seleção de tópicos-chave e trechos foi organizada em uma tabela com a seguinte estrutura: os tópicos (coluna A), o número da COP (coluna B), e os diferentes trechos associados (coluna C). Os trechos selecionados não são exclusivos, quer dizer, um mesmo trecho pode aparecer em dois ou mais tópicos. Como exercício final, unificamos as três tabelas para comparar os resultados do processo.

Já na terceira fase, realizamos uma modelagem de tópicos usando Voyant Tools, uma ferramenta online de uso gratuito e de código aberto, “que visa facilitar a leitura e práticas interpretativas para estudantes e acadêmicos das humanidades digitais, assim como para o público em geral.” Uma das funcionalidades que Voyant oferece é a modelagem de tópicos, que usa uma versão ajustada por David Mimno do modelo estatístico gerativo Alocação Latente de Dirichlet. Esta técnica de modelagem permite a clusterização de variáveis latentes em tópicos ou temas a partir da atribuição de palavras de todos os documentos a um número designado de agrupamentos/tópicos.

Na visualização a seguir você pode observar e interagir com o resultado da modelagem. Vale a pena mencionar que a ordem das palavras [da esquerda para a direita] é importante porque as primeiras palavras contribuem mais na definição dos diferentes tópicos. Na nossa análise, realizamos 300 iterações para refinar o modelo e associar de maneira mais precisa as palavras aos diferentes tópicos, assim como também eliminamos as palavras vazias e alteramos o número de 5000 palavras analisadas em cada documento — você pode alterar esses valores na visualização.

A partir da finalização das primeiras três fases, identificamos uma concordância entre os resultados das leituras individuais, e uma afinidade com alguns dos tópicos criados pela modelagem feita no Voyant. Nesta fase, realizamos um processo de filtragem, edição e macro-categorização da lista inicial de tópicos. Tópicos relacionados foram agrupados em categorias exclusivas, como por exemplo: “dinheiro”, “milhões” e “economia” ficaram dentro da categoria “Economia” ; “energia”, “biocombustíveis” e “fósseis” se transformaram em “Energia”. No total, finalizamos esta fase com 34 categorias.

As fases seguintes (5, 6 e 7) tiveram como objetivo contextualizar, comparar e refinarnossa lista de tópicos. Primeiro, exploramos os tópicos listados pela UNFCCC, elementos centrais da organização, para observar possíveis relações com os nossos resultados. Embora os tópicos da organização sejam mais amplos do que as COPs, incluindo uma série de iniciativas e projetos mais abrangentes, encontramos correspondência com seis tópicos listados: Adaptação e resiliência, Finanças climáticas, Uso da terra, Comunidades locais e plataforma de pessoas indígenas, Mecanismos de mercado e de não-mercado, e Ambição pré-2020 e implementação.

Em seguida, selecionamos tópicos específicos associados com a realidade ambiental do Brasil nos últimos quatro anos, e que também nos interessassem, seja em seus desdobramentos em reportagens ou futuras pesquisas. Alguns destes tópicos apareceram no exercício de codificação individual, assim como na modelagem de tópicos em Voyant: Biomas, Cerrado, Comunidades e Fundo Amazônia

Finalmente, fizemos uma revisão de literatura focada em pesquisas que aplicassem análises de conteúdo ou outra metodologia de análise textual usando discursos e declarações emitidas nas COPs. Revisamos artigos sobre:

Esta revisão nos permitiu entender como funcionam os processos de negociação durante as COPs, como aplicar metodologias quantitativas em grandes corpus textuais, comparar de forma transversal posições e tópicos importantes levantados por outros países e blocos de negociação, e contrastar a nossa lista de tópicos. Embora nosso corpus esteja incompleto (discursos faltantes) e limitado (quantidade de documentos) em comparação com as pesquisas que trabalham com declarações no segmento de alto nível de diferentes países —entre outros materiais que compõem o corpus da maioria de pesquisas referenciais—, evidenciamos a existência de tópicos compartilhadosentre os resultados desses estudos e nosso processo de classificação.

Na fase final, definimos os tópicos, agrupamos categorias/tópicos similares (por exemplo, “empregos” dentro da categoria “Economia”) e codificamos em uma tabela todos os trechos selecionados, segundo a edição da COP e o tópico correspondente.

No total, codificamos 553 trechos em 27 categorias:

5. Limitações e passos futuros

Em termos metodológicos, é importante salientar que nosso esquema de categorização e codificação manual pode conter possíveis omissões e seleção de tópicos não relevantes em termos estatísticos. Em outras palavras, a metodologia aplicada não segue cálculos estatísticos robustos.

Adicionalmente, o uso exclusivo de discursos proferidos no segmento do alto nível e na sessão plenária não permite determinar ou inferir posicionamentos estatísticos e analiticamente sólidos sobre as posições climáticas. Como mencionamos anteriormente, nosso objetivo, reduzido em seu escopo, é ter um quadro de referência textual que permita acompanhar, fiscalizar e contrastar aquilo que o governo prega e aquilo que faz.

Devido à pouca documentação disponível sobre as edições anteriores à COP 10, o nosso recorte temporal foi alterado: 2004-2021, excluindo 2006 (COP12) e 2008 (COP14). Embora exista uma perda de conteúdo significativo para análise, devido à ausência dos documentos correspondentes a onze edições do evento, consideramos que o período analisado cobre significativamente as conferências realizadas no século XXI, permitindo apontar as discussões contemporâneas na política climática brasileira. Reforçamos que nosso objetivo não é realizar uma análise temporal das mudanças discursivas do governo brasileiro nas COPs. Portanto, a utilidade do projeto é válida e se mantém.

Nosso objetivo é manter o repositório com dados atualizados e continuar a busca dos discursos ausentes —aguardamos a resposta dos recursos e pedidos feitos através da LAI. Pretendemos expandir o escopo deste projeto, incluindo documentos adicionais ao corpus, tanto do segmento de Alto Nível, assim como outro tipo de documentação textual vinculada às COP, como submissões das delegações, relatórios nacionais, para consolidar o material como boa fonte de consultas para o público geral e especialistas.

6. Referências