YData lança Data-Centric AI Community

A Data-Centric AI Community promove transformação digital guiada pela comunidade e orientada por especialistas para um melhor desenvolvimento de inteligência artificial.

A tecnológica YData acaba de apresentar um novo projeto, a Data-Centric AI Community, uma comunidade que tem como finalidade ajudar os Data Scientists a melhorarem a qualidade dos seus dados, produzindo modelos de AI melhores.

Criadora da primeira plataforma de desenvolvimento de qualidade de dados para acelerar o desenvolvimento de soluções de IA, a YData quer assim quebrar as barreiras que atualmente afetam as equipas de Data Science, investigadores e estudantes, e criar um espaço onde as questões de qualidade de dados são discutidas e resolvidas.

Numa altura em que os estudos de indicam que a transformação digital não será possível sem dados de alta qualidade, aliada à recente mudança de paradigma na abordagem ao desenvolvimento de IA, de centrada nos modelos para um desenvolvimento ‘centrado nos dados’, a start-up fundada por Gonçalo Martins Ribeiro e Fabiana Clemente, e 2019, pretende dar o seu contributo para facilitar esta transformação, orientada pela comunidade e por peritos da área.

“Entendemos que é essencial haver uma comunidade que impulsione a mudança do paradigma para uma IA centrada nos dados. Pretendemos concentrar-nos no profiling de dados, dados sintéticos e etiquetagem de dados, os pontos críticos mais relevantes para Data Scientists”, afirmou Gonçalo Martins Ribeiro.

Desde 2020 que a YData tem apostado no desenvolvimento de soluções open source e na transformação de IA impulsionada pela comunidade, nomeadamente com o lançamento da  Synthetic Data Community.  Em 2021, lançou dois projetos de código aberto, o ydata-synthetic e o ydata-quality, com o objetivo de assegurar que as equipas de ciência de dados têm acesso a dados de alta qualidade.

Refira-se que sintetizador de dados da YData utiliza técnicas de deep learning de última geração para aprender a informação estatística com dados reais, replicando-a num novo conjunto de dados. Já o Pandas Profiling, ajuda a traçar um perfil dos dados e a compreender a qualidade dos dados utilizando apenas algumas linhas de código.

“Acreditamos que ter dados de qualidade é verdadeiramente revolucionário e que ao criar dados de alta qualidade semelhantes a dados do mundo real, que inicialmente eram inacessíveis, possibilita desbloquear infinitas possibilidades”, reforçou Gonçalo Martins Ribeiro. Para o cofundador da YData, “ser capaz de traçar o perfil e compreender os dados, no início do desenvolvimento, é crucial e pode poupar muito tempo e dinheiro às organizações”.

Lembra ainda que “nem todas as empresas, investigadores ou estudantes têm acesso aos dados mais valiosos, como é o caso das gigantes tecnológicas. À medida que os algoritmos de ML evoluem rapidamente, é seguro dizer que são os dados de alta qualidade e em escala o recurso mais escasso em IA. Precisamos de encontrar formas de melhorar os dados utilizados para o desenvolvimento da IA. A Data-Centric AI Community é um passo no sentido de resolver esse problema”.

Comentários

Artigos Relacionados