Microsoft apresenta modelo inédito de IA dedicado a planilhas
Por Guilherme Haas |

Pesquisadores da Microsoft publicaram um artigo sobre o desenvolvimento do SpreadsheetLLM, um modelo de linguagem de larga escala (LLM) projetado especificamente para a leitura e interpretação de planilhas. A nova IA promete transformar a interação com grandes bancos de dados, com a automatização de tarefas complexas e maior controle sobre os documentos.
SpreadsheetLLM: IA para planilhas
Segundo o estudo publicado pelo time da Microsoft, o SpreadsheetLLM é um modelo de linguagem de IA feito exclusivamente para planilhas, sendo otimizado para trabalhar com linhas, colunas e fórmulas de todos os tamanhos e formatos.
O modelo ajuda a estruturar dados, fornecer interpretações precisas e gerar relatórios detalhados. “Nosso objetivo é liberar e maximizar o potencial dos LLMs para compreensão e raciocínio em planilhas”, explicam os cientistas da Microsoft no artigo.
Para superar as limitações de processamento de grandes planilhas pelos LLMs tradicionais, os pesquisadores desenvolveram o SheetCompressor — um sistema de compressão que reduz o tamanho das planilhas e melhora a eficácia da leitura e interpretação.
Leia mais:
- 15 prompts do ChatGPT para Excel
- WhatsApp para Android vai traduzir mensagens no dispositivo, mostra site
Os resultados demonstram que a detecção de tabelas obteve um desempenho 25,6% melhor sem o compressor e até 78,9% com ele. Isso representa uma melhoria significativa em relação aos métodos existentes, possibilitando que modelos como o GPT-4 processem informações de forma mais eficiente.
O SheetCompressor utiliza três módulos principais para alcançar esses resultados: ancoragem estrutural para compreensão de layout, tradução de índice invertido para eficiência de tokens e agregação de formatos de dados para células numéricas. Esses módulos trabalham juntos para criar uma versão compacta da planilha, facilitando o processamento sem perder a integridade dos dados.
Além de melhorar a detecção de tabelas, o SpreadsheetLLM mostrou-se altamente eficaz em tarefas de perguntas e respostas sobre planilhas. Para essa operação, os pesquisadores desenvolveram a abordagem "Chain of Spreadsheet" (CoS), que decompõe o raciocínio sobre planilhas em um esquema de detecção, correspondência e raciocínio.
O modelo representa um avanço significativo no campo da inteligência artificial aplicada a planilhas. Embora a aplicação comercial do SpreadsheetLLM ainda não esteja confirmada, sua integração com ferramentas como o Excel, do pacote Office, pode ser uma possibilidade futura.
Fonte: arXiv