Os cientistas brasileiros que inventaram a ferramentastake aposta esportivacorreção ortográfica do Word:stake aposta esportiva
- Evanildo da Silveira
- De São Paulo para a BBC Brasil

Crédito, ICMC/USP
A cientista Maria das Graças Volpe Nunes foi a coordenadora do projeto que criou o corretor
stake aposta esportiva Quem já escreveu no Word, o processadorstake aposta esportivatextos da Microsoft, com certeza usou o corretor ortográfico do programa - aquele que sublinha palavras erradas e sugere suas versões corretas. Diante da palavra "coreta", por exemplo, ele vai indicar, por meiostake aposta esportivauma linha vermelha embaixo dela, que está errada, e quando o corretor for acionado para corrigir todo o texto, ele vai sugerir, para essa palavra, pela ordem: "correta", "corveta", "corta", "coreto", "corretas" e "careta".
O que poucos sabem é que esta tecnologiastake aposta esportivacorreçãostake aposta esportivatexto para o português tem sotaque caipira - no bom sentido, é claro. Ela foi desenvolvida no interior paulista, no Institutostake aposta esportivaCiências Matemáticas estake aposta esportivaComputação (ICMC), da Universidadestake aposta esportivaSão Paulo,stake aposta esportivaSão Carlos, a 241 quilômetros da capital.
É uma história que começoustake aposta esportiva1993, quando a Itautec, uma fábrica brasileirastake aposta esportivacomputadores hoje extinta, procurou o ICMC, por causastake aposta esportivaseus pesquisadores com formaçãostake aposta esportivacomputação com alguma ligação com linguagem natural, para que desenvolvessem um sistemastake aposta esportivacorreção ortográfica - que depois evoluiu para gramatical e estilística.
Na época, a internet ainda era novidade. "A ideia era vender o sistema na formastake aposta esportivaum CD, principalmente para usostake aposta esportivaescritórios, no auxílio à redaçãostake aposta esportivacartas e memorandos, ou seja, para usuários com ensino fundamental ou médio", lembra a cientista da Maria das Graças Volpe Nunes, do ICMC, coordenadora do projeto.
"Aceitamos o desafio e,stake aposta esportivapouco maisstake aposta esportivaum ano, já tínhamos a primeira versão do revisor, que, como projeto científico, ficou conhecido como ReGra."
Maria das Graças conta que, para desenvolver a tecnologia do corretor, foi formada uma grande equipestake aposta esportivapesquisadores, estudantesstake aposta esportivacomputação e linguística. O projeto teve apoio da Fundaçãostake aposta esportivaAmparo à Pesquisa do Estadostake aposta esportivaSão Paulo (Fapesp), durante um certo período, num programastake aposta esportivaparceria com a Itautec. Essa empresa, porstake aposta esportivavez, financiou a equipe durante 15 anos seguidos.
Em 2000, a Microsoft adquiriu uma licença da Itautec para incluir o revisor desenvolvido no ICMC nos seus programas do pacote Office. Mas a equipe continuou a dar assessoria para a Microsoft: novas regrasstake aposta esportivacorreção eram implementadas, adaptações eram feitas, como à nova ortografia do português, entre outras coisas. "Em 2008, a Itautec vendeu definitivamente os direitos do produto à Microsoft, e portanto o projeto chegou ao final, com bastante sucesso, por sinal", diz Maria das Graças.

Crédito, Getty Images
Em 1993, uma fábrica brasileirastake aposta esportivacomputadores procurou cientistas para eles desenvolverem um corretorstake aposta esportivatexto
Seu colega no projeto, o físico Osvaldo Novaisstake aposta esportivaOliveira Junior, do Institutostake aposta esportivaFísicastake aposta esportivaSão Carlos (IFSC) da Universidadestake aposta esportivaSão Paulo (USP), diz que o ReGra foi o primeiro revisor gramatical desenvolvido para o português.
"No nosso caso, com o léxico da versão brasileira da nossa língua", explica. "Quase na mesma época, uma empresastake aposta esportivaPortugal, ativa até hoje, desenvolveu um revisor para a versão do idioma como é falado lá. O lançamento do deles deve ter ocorrido pouco depois do nosso."
Segundo Oliveira, o ReGra faz revisão com basestake aposta esportivaregras - algumasstake aposta esportivaanálise sintática e algumas empíricas,stake aposta esportivamaneira semelhante ao revisor do inglês disponível no Word da Microsoft. "Que eu saiba, a Microsoft nunca desenvolveu revisor para o português", diz.
Procurada pela BBC Brasil a empresa se manifestou por meiostake aposta esportivauma nota: "Inicialmente, a Microsoft realizou acordos para a utilizaçãostake aposta esportivalicençasstake aposta esportivacorretores ortográficosstake aposta esportivaterceiros para muitos idiomas ao redor do mundo, mas gradativamente todos eles foram migrados para a plataforma da empresa. A ferramenta brasileira fez essa migração na versão do Office 2010, o que significa que a tecnologia presente no produto já é 100% Microsoft."
De acordo com Oliveira, pode-se dizer que houve pouquíssimo avançostake aposta esportivarevisão gramatical automática nos últimos anos, pois aparentemente as empresas não estão dispostas a fazer grandes investimentos. "Isso seria necessário, pois hoje um revisor gramatical poderia ser muito mais eficiente se combinasse regras com métodos estatísticos estake aposta esportivaaprendizadostake aposta esportivamáquina", complementa.
Oliveira diz que a Itautec "apostou muito numa equipestake aposta esportivajovens pesquisadores, sem garantiastake aposta esportivaretorno. Apenas para ilustrar, a Itautec investiu o equivalente a cercastake aposta esportivaUS$ 2 milhões (tínhamos que memorizar valoresstake aposta esportivadólares, pois a inflaçãostake aposta esportiva1993 ainda era muito alta) nos primeiros anos do trabalho. Não prometemos fazer o revisor, mas apenas um estudo sobre o que era necessário e como criá-lo."

Crédito, IFSC/USP
O físico Osvaldo Novaisstake aposta esportivaOliveira Junior, da Universidade Federalstake aposta esportivaSão Carlos, também participou da criação do programa
O investimento da empresa tornou possível a formaçãostake aposta esportivauma equipe multidisciplinar, e multi-institucional, que congregava professores das universidadesstake aposta esportivaSão Paulo (USP), Federalstake aposta esportivaSão Carlos (UFSCar), e Estadual Paulista (Unesp) do câmpus Araraquara, para realizar pesquisas na áreastake aposta esportivaProcessamentostake aposta esportivaLinguagem Natural (PLN).
"Acho que aindastake aposta esportiva1993 decidimos que o grupo deveria ganhar um nome, que é o mesmo até hoje: Núcleo Insterinstitucionalstake aposta esportivaLinguística Computacional (NILC)", lembra Oliveira. "A meu ver, a criação dele é o maior legado do Projeto ReGra."
De acordo com ele, o NILC é hoje um dos maiores centrosstake aposta esportivageraçãostake aposta esportivatecnologia para o processamento automático do português. "Certamente é o que mais disponibilizou gratuitamente recursos lingüísticos computacionais para o nosso idioma", diz.
"Isso foi possível porque, desde o início, adotamos a políticastake aposta esportivafranquear os recursos, como léxicos, corpus (basestake aposta esportivatextos, escritos ou falados, organizada e anotada, que possa servir como recurso linguístico-computacional) e ferramentasstake aposta esportivaprocessamento a colegasstake aposta esportivatodo o mundo. Mesmo aqueles recursos acessórios para o desenvolvimento do ReGra foram disponibilizados, com a autorização da Itautec."
Mas o NILC não parou por aí. Oliveira destaca os projetos que o núcleo desenvolveu e vem desenvolvendo nas áreasstake aposta esportivatradução automática, terminologia, simplificaçãostake aposta esportivatexto, reconhecimentostake aposta esportivaautoria, identificaçãostake aposta esportivafake news (notícias falsas), sistemasstake aposta esportivabusca, usostake aposta esportivalinguagem para detecçãostake aposta esportivadoenças e reconhecimentostake aposta esportivafala, por exemplo.
"Ressalto que o processamento automáticostake aposta esportivalíngua natural está presentestake aposta esportivamuitos produtos, como os assistentes inteligentes que reconhecem voz e obedecem a comandos, os tradutores automáticos e os sistemasstake aposta esportivabusca na internet", explica.
Segundo ele, são tantos os produtos que muitos dos desenvolvedores já não se referem ao trabalho como sendostake aposta esportivaProcessamentostake aposta esportivaLinguagem Natural. "Como hoje uma das tarefas mais relevantes na tecnologia é ensinar uma máquina a ler (e compreender), o PLN é uma das áreas mais importantesstake aposta esportivaciência e tecnologia", diz.
"Ninguém fala nisso, mas uma análise detalhada dos sistemas inteligentes (cerne da Inteligência Artificial) indica claramente que essa afirmação é irrefutável."








