Google Tradutor ganha mais 110 idiomas com ajuda da IA
Por Bruno De Blasi | Editado por Douglas Ciriaco | 27 de Junho de 2024 às 08h16
O Google Tradutor ficou ainda mais completo através de uma expansão anunciada nesta quinta-feira (27): com a atualização, a plataforma ganhou mais 110 idiomas, incluindo o tão esperado cantonês e o português de Portugal. A novidade se deu graças ao modelo de linguagem PaLM 2, que auxiliou no processo de inclusão de novas opções de tradução no serviço do Google.
A atualização incrementa ainda mais as possibilidades de tradução pela ferramenta, inclusive com línguas que quase entraram em extinção. Ao mesmo tempo, a empresa passa a atender uma grande população de falantes que ainda não podiam usar o serviço com sua língua nativa, por exemplo.
Não à toa, a empresa sustenta que os novos idiomas representam mais de 614 milhões de falantes, possibilitando a tradução de cerca de 8% da população mundial que não estavam contemplados pelo app.
“Algumas são línguas em destaque do mundo, com mais de 100 milhões de falantes”, aponta o artigo assinado pelo engenheiro sênior Isaac Caswell, que faz parte da equipe do Google Tradutor. “Outros são falados por pequenas comunidades de povos indígenas e alguns quase não têm falantes nativos, mas têm esforços ativos de revitalização.”
A empresa ainda observa que cerca de um quarto das novas línguas vêm de África. São os casos dos idiomas Fon, Kikongo, Luo, Ga, Swati, Venda e Wolof.
Mais idiomas no Google Tradutor
Apesar do apoio da IA, os desenvolvedores lidaram com algumas dificuldades para lançar os novos idiomas. É o caso do cantonês, que é um dos idiomas mais solicitados pelos usuários, mas que não foi tão simples de ser implementado. “Como o cantonês muitas vezes se sobrepõe ao mandarim na escrita, é complicado encontrar dados e treinar modelos”, justificou o Google.
Confira a lista de idiomas que foram acrescentados no Google Tradutor:
- Abecásio, Achinês, Acholi, Afar, Alur, Avar e Awadhi;
- Balinês, Balúchi, Baoulé, Basquir, Batak Karo, Batak Simalungun, Batak Toba, Bemba, Betawi, Bikol, Bretão e Buriate;
- Cantonês, Chamorro, Checheno, Chuques, Chuvache, Crioulo Mauriciano e Crioulo Seichelense;
- Dari, Dinka, Dombe, Dyula e Dzongkha;
- Feroês, Fijiano, Fon, Friulano e Fulani;
- Gá;
- Hakha Chin, Hiligaynon e Hunsrik;
- Iban;
- Jingpo;
- Kalaallisut, Kanuri, Kapampangan, Khasi, Kiga, Kikongo, Kituba, Kokborok e Komi;
- Latgaliano, Ligure, Limburguês, Lombardo e Luo;
- Mari, Madurês, Macassar, Malaio (Jawi), Mam, Manx, Marshalês, Marwadi e Minang;
- Náuatle (Huasteca Oriental), Ndau, Ndebele (Sul), Nepalbhasa (Newari), Nko e Nuer;
- Occitano e Osseto;
- Patois Jamaicanos, Pangasinan, Papiamento;
- Português (Portugal) e Punjabi (Shahmukhi);
- Q'eqchi';
- Romani e Rundi;
- Sami (Norte), Sango, Santali, Shan, Siciliano, Língua Silesiana, Susu e Swati
- Tártaro da Crimeia, Taitiano, Tamazight, Tamazight (Tifinagh), Tétum, Tibetano, Tiv, Tok Pisin, Tonganês, Tsuana, Tulu, Tumbuka e Tuvan;
- Udmurte;
- Venda e Veneziano;
- Waray;
- Uolot;
- Yakut e Yucateca Maia.
- Zapoteca.
Os novos idiomas estarão disponíveis a todos tanto na versão web quanto nos aplicativos para Android e para iOS, mas ainda será preciso esperar: ao Canaltech, o Google informou que as novas línguas estarão na plataforma "nas próximas semanas", sem dar um dia exato para o lançamento da atualização.
Atualizado às 8h27, no dia 28 de junho, com a lista completa de idiomas e a previsão de lançamento oferecidas pelo Google.