- O projeto African Next Voices lançou 9.000 horas de dados de fala em 18 línguas africanas.
- A iniciativa visa aumentar a inclusão dessas línguas em modelos de inteligência artificial.
- O projeto é apoiado pela Fundação Gates e busca combater a sub-representação de mais de 2.000 idiomas falados no continente.
- As gravações foram feitas na África do Sul, Quênia e Nigéria, com temas relevantes para as comunidades locais.
- Os dados serão disponibilizados em acesso aberto para desenvolvedores, visando melhorar a tradução automática e o reconhecimento de fala.
O projeto African Next Voices lançou 9.000 horas de dados de fala em 18 línguas africanas, com o objetivo de aumentar a inclusão dessas línguas em modelos de inteligência artificial (IA). A iniciativa, apoiada pela Fundação Gates, busca combater a sub-representação de mais de 2.000 idiomas falados no continente, que frequentemente são negligenciados em ferramentas de IA.
As gravações foram realizadas por especialistas em linguística em três países: África do Sul, Quênia e Nigéria. Os dados coletados serão disponibilizados em acesso aberto para desenvolvedores, permitindo a criação de modelos de linguagem que podem melhorar a tradução automática e o reconhecimento de fala. Ife Adebara, CTO da organização Data Science Nigeria, destaca que a inclusão desses dados é crucial para o desenvolvimento de tecnologias que atendam às necessidades locais.
O projeto também se concentra em áreas de desenvolvimento, como saúde, agricultura e educação. Sanjay Jain, diretor da Fundação Gates, ressalta que a falta de dados locais é um desafio significativo para a escalabilidade das ferramentas de IA. As gravações foram realizadas em um formato que captura a linguagem do dia a dia, essencial para a criação de modelos que reflitam a realidade dos falantes.
Em cada país, os pesquisadores escolheram temas relevantes para as comunidades locais, garantindo que os dados coletados sejam úteis e aplicáveis. Vukosi Marivate, cientista da computação da Universidade de Pretoria, afirma que a colaboração entre organizações é fundamental para o sucesso do projeto e para o aprimoramento das tecnologias de linguagem na África.