Uma solução que disponibiliza dados que não sejam decifráveis e que não coloquem em causa a privacidade das pessoas é o foco da solução criada pela jovem YData. Em entrevista ao Link To Leaders, os fundadores da start-up explicam o projeto e revelam as suas ambições internacionais.

Gonçalo Martins Ribeiro, 30 anos, formado em engenharia de software, com mestrado em gestão de projetos, e Fabiana Clemente, 27 anos, formada em matemática aplicada, com mestrado especializado na área de data science, são os rostos da YData, uma start-up na área dos dados que está a dar os primeiros passos no mercado.

Começou em meados deste ano, quando Gonçalo e Fabiana deixaram os respetivos empregos para se dedicarem a tempo inteiro a um projeto conjunto, onde ele assume o cargo de CEO da YData, e ela de Chief Data Officer. Desde então, estão a tentar implementar alguns pilotos em empresas nacionais e a planear uma ronda de investimento, para os próximos seis meses, que lhes permita aumentar a equipa e continuar a desenvolver novas soluções no domínio dos dados sintéticos, revelaram ao Link To Leaders.

Como é que a YData deu os primeiros passos?
Gonçalo: Conhecemo-nos porque estávamos os dois na Novabase. A Fabiana era consultora de business intelligence e eu estava a desenvolver software. A partir daí fomos mantendo o contacto e nos últimos anos, deparamo-nos com o facto de estarmos os dois a trabalhar com dados. A Fabiana como data cientist e eu a gerir projetos na área de dados. Então começamos a comentar as várias situações que nos surgiam no dia a dia, seja o acesso aos dados para projetos, sejam as questões da privacidade.

Fabiana: Eu, entretanto, depois da Novabase, passei pelo Vodafone Group, e como arquiteta de soluções comecei a deparar-me com alguns problemas em termos de dados. Tudo o que eram projetos relacionados com dados para inovação ou para avanço tecnológico dentro da empresa, era extremamente bloqueado. Isto porque para desenvolvimento de soluções com base em machine learning há necessidade de que os dados sejam reais, pois caso contrário não se pode tirar qualquer conclusão. Tudo isto era bloqueado e levava-nos a ter projetos com um life cycle de um ano, o que era impensável para pequenos projetos de inovação e provas de conceitos. Este foi um dos problemas que identifiquei a nível corporate e muitos outros colegas que trabalham na mesma área sentem a mesma dificuldade a nível corporate.

Depois tive também uma experiência numa start-up e aí era o outro lado da moeda: já não era tanto o bloqueio de acesso a dados, era mais a não existência deles. Isto levou-me a falar com o Gonçalo, e com outros colegas, e a perceber que havia uma oportunidade no mercado que ainda não está a ser explorada que é a privacidade dos dados e o acesso aos mesmos. Ou seja, como é que podemos fazer para aceder a informação sem prejudicar a privacidade do utilizador final e também das empresas no que toca a regulamentações de privacidade.

Foi aí que surgiu a nossa ideia de criar a YData. Decidimos que era o momento certo para a aposta. E como considero que estar sempre a estudar é benéfico, foi nessas minhas pesquisas que encontrei uma das soluções que poderia responder a este problema.

Gonçalo: Podemos dividir o tipo de problemas que encontramos ao longo do nosso trabalho em três categorias: O primeiro tem a ver com a nova legislação, o RGPD, o que torna o problema urgente e obrigatório para as empresas. Por outro lado, a tal questão da partilha de dados, seja dentro da empresa ou para fora da empresa, é muito difícil, demora muito tempo e, finalmente, as técnicas de anonimização que existem atualmente já não funcionam.

Então o que fizemos foi uma forma disponibilizar dados que não sejam decifráveis e que não coloquem em causa a privacidade das pessoas. A nossa solução passa por criar dados sintéticos que têm as mesmas caraterísticas dos originais. Isto é, podemos ter dados originais sobre nós, com as nossas identificações, mas depois o que temos é um modelo de inteligência artificial que vai aprender connosco e que vai criar outras pessoas “fictícias” que se irão comportar de forma semelhante à nossa. Ou seja, nunca será igual para não permitir a identificação.

Mas se analisarmos do ponto de vista populacional os dados terão o mesmo valor, permitem treinar modelos de inteligência artificial, colocar em ambiente de teste, fazer analitics, ou seja, as capacidades acabam por ser as mesmas que as reais. O projeto começou este ano. Eu comecei a trabalhar a tempo inteiro em maio e a  Fabiana em julho.

Estão a dividir áreas de trabalho é isso?
Gonçalo: Exatamente. A Fabiana está com a área de dados, de desenvolvimento da solução em machine learning, enquanto eu estou com a parte de software que é necessária para garantir que a solução seja implementável em empresas, assim como toda a parte de negócio.

Estão em alguma incubadora?
Fabiana
: Estamos na Startup Lisboa, mas em modo de incubação virtual porque temos trabalhado de casa.

Já têm clientes?
Gonçalo: Estamos a iniciar alguns pilotos. Estamos em contato com algumas empresas, vamos participar no Altice International Innovation Awards e há a possibilidade de fazer uma prova de conceito com a Altice. E também estamos a falar com investidores que nos podem colocar em contato com várias empresas.

“Daí precisarmos de clientes e de investimento para podermos ter uma equipa maior para tornar isto possível e viável”.

Neste momento estão à procura de investimento é isso?
Fabiana: Sim, e de clientes. Temos o produto, mas é preciso fazer uma validação de mercado. Ver como podemos melhorar de forma a servir a maior parte das empresas. Daí precisarmos de clientes e de investimento para podermos ter uma equipa maior para tornar isto possível e viável.

Qual o tipo de investidor ideal nesta fase?
Gonçalo:
Gostaríamos de entrar uma aceleradora americana para ter acesso aos mercado da América do Norte e do Canadá. Isto porque apesar da regulação do RGPD ser europeia começam a surgir muitas leis na América do Norte, mais ao nível estadual do que propriamente do país. Na Europa temos o mercado britânico e o alemão que realmente são bons para atuarmos, mas fora isso não existe um mercado muito relevante. Em Portugal estamos a iniciar estes pilotos, que nunca serão projetos de uma dimensão muito grande. Por isso, a nossa ideia é tornarmo-nos globais assim que possível.

E nesses pilotos conseguem ser remunerados?
Gonçalo: A nossa ideia é essa. Começar com pilotos pagos.

Quanto já investiram no projeto?
Fabiana: Cerca de 10 a 15 mil euros.

Nos próximos seis meses vamos procurar fazer uma ronda de um milhão.

E o que precisam em termos de investimento para conseguirem dar o salto?
Gonçalo: Nos próximos seis meses vamos procurar fazer uma ronda de um milhão. Se encontrarmos um investidor que invista um milhão de euros, entretanto, também conseguimos ir buscar fundos europeus. Esse investimento será maioritariamente para investir em recursos humanos, para aumentar a equipa.

“(…) numa empresa grande em que o acesso aos dados é mais difícil, com esta solução conseguimos reduzir este life cycle de acesso a dados”.

Qual o tipo de empresas mais adequadas para o tipo de solução que propõem?
Gonçalo: Grandes empresas onde podemos causar mais impacto. Ou seja, numa empresa grande em que o acesso aos dados é mais difícil, com esta solução conseguimos reduzir este life cycle de acesso a dados. Em vez de serem necessárias várias autorizações, ao criarmos dados sintéticos eles ficam imediatamente disponíveis. Além disso nessas empresas, tendo outra dimensão, também conseguimos ter um projeto maior.

Fabiana: Em termos de mercados, os primeiros em que queremos investir para além do perfil que o Gonçalo referiu, são os mercados financeiros, no caso a banca e as seguradoras. Achamos que são os primeiros que realmente precisam de tirar insights dos dados porque trabalham com dados sensíveis.

Não estamos a falar de setores de atividade como, por exemplo, o setor automóvel ou telecomunicações…
Fabiana
: Não, ainda não é tanto por aí. Os pilotos claro que vamos aceitar, havendo a possibilidade com a Vodafone, por exemplo. Mas as telecomunicações não serão o nosso primeiro target apesar deles realmente serem muito fortes em termos de inovação. É um dos setores que mais inova e são disruptivos, mas na área das redes essencialmente. A banca e as seguradoras, principalmente as seguradoras, são os que ainda procuram tirar mais informação a partir dos dados. E são os que realmente trabalham com dados extremamente sensíveis.

Sendo uma start-up ainda pouco conhecida, como é que conseguem conquistar os clientes?
Fabiana
: A partir dos contactos pessoais dentro do nosso networking. São pessoas que confiam em nós. Ainda não é tanto pelo nome da empresa, mas mais pelos nossos nomes e pelas pessoas que nos conhecem.

“(…) a DefinedCrowd. É sem dúvida uma inspiração”.

Há algum exemplo internacional que tenha sido uma inspiração para vocês?
Fabiana
: Sim. Por exemplo, a DefinedCrowd. É sem dúvida uma inspiração.

Também gostariam de fazer a mesma trajetória?
Gonçalo: Sim. Sem dúvida. Trabalhamos ambos na área dos dados, cada um em dados diferentes, mas podíamos até vir a trabalhar juntos.

Veem-se mais a trabalhar com empresas internacionais, fora de Portugal, ou numa primeira fase em Portugal?
Fabiana
: Mesmo numa primeira fase vemo-nos mais a trabalhar com empresas internacionais porque, tal como o Gonçalo referiu, achamos mesmo que a nível internacional existe uma maior preocupação e um maior entendimento do que uma área de dados precisa e tem necessidade.
Gonçalo: Acaba por haver maior abertura para novas soluções.

“(…) a nossa solução permite que essas empresas possam, segmentar os targets sem que tenham qualquer problema com as regulamentações porque estão a analisar dados de pessoas que na realidade não existem (…)”

O que é que a vossa solução permite que as empresas ofereçam aos clientes em termos de produto final?
Fabiana
: Por exemplo, no caso específico de empresas que normalmente trabalham na área de risco e de suporte à decisão – áreas muito importantes na empresa tanto para a concessão de crédito como para a criação de novos produtos de crédito, cada vez mais desenhados à medida dos consumidores-, a importância dos dados é realmente visível e percetível. Nesse sentido, a nossa solução permite que essas empresas possam, sem dificuldade avançar, nessa perspetiva e segmentar os targets sem que tenham qualquer problema com as regulamentações porque estão a analisar dados de pessoas que na realidade não existem, mas que no entanto acabam por fazer fit na realidade.

Outro benefício, por exemplo, é que as empresas podem ter desenvolvimento interno, mas não conseguem captar os melhores talentos. Com este tipo de soluções nem tudo precisa de ser desenvolvido in house. Pode ser feito, por exemplo, por pessoas de research, consultoras, empresas que realmente tenham experiência no mercado, que consigam desenvolver projetos melhores para a própria empresa.

Esta área ainda é muito associada ao universo masculino. Como é que a Fabiana lida com esta realidade?
Fabiana
: Realmente tenho notado que existe ainda um certo preconceito no mercado e que quando estamos numa reunião, normalmente a pergunta é para o Gonçalo. Noto que ainda tenho de fazer um extra para ser ouvida e para ser levada um pouquinho mais a sério. Porque normalmente veem uma pessoa nova, mulher…. ok ouvem-nos, mas não com a mesma preocupação como se fosse um homem. Isso ainda existe muito no nosso mercado.

“Vão precisar de existir mais DefinedCrow com Danielas Braga à frente para as mulheres continuaram a destacar-se”.

Nas grandes empresas?
Fabiana
: Nem tanto, depende da empresa. Há empresas que primam muito pela igualdade, pelas mulheres em cargos de chefia, e já se começa a sentir um respeito e uma igualdade maior entre homens e mulheres, quer na decisão quer na forma como as opiniões são abordadas. No entanto, nos nossos mercados, no geral, mas sobretudo na área de machine learning ainda vai levar alguns anos, até porque ainda há poucas mulheres. Vão precisar de existir mais DefinedCrow com Danielas Braga à frente para as mulheres continuaram a destacar-se. E acho que é nesse sentido que as mulheres têm de evoluir. Somos capazes, temos capacidade e conseguimos ter start-ups de sucesso. E acho que é esse caminho.

Como gostariam de ter a vossa start-up daqui a um ano?
Gonçalo
: Já com uma equipa grande.
Fabiana
: Entre 10 a 15 pessoas é o que nos queríamos. Já com um produto no mercado, pelo menos em dois ou três clientes e a evoluir o produto. Com certeza que o produto não fica só por esta solução, há muitas possibilidades.

As vossas ambições são internacionais?
Gonçalo: Sim. Temos despertado alguma atenção de investidores e eles próprios dizem para não nos limitarmos a Portugal.

Portanto, o vosso foco agora é arranjar um investidor que permita cumprir estes objetivos?
Gonçalo
: Exato. Mas gostaríamos de manter a equipa a trabalhar em Portugal porque os portugueses são muito competentes nesta área.

Fabiana: Eu sou muito a favor de um ambiente multicultural e acho que a diversidade trás alguma vantagem, principalmente quando estamos a falar de comunicação com clientes externos. Mas realmente queríamos a equipa cá, apesar de termos uma política completamente remote. Ou seja, não é impeditivo uma pessoa que não esteja em Portugal poder trabalhar para a nossa empresa.

Já houve algum conselho de um investidor que vos tenha desaminado?
Gonçalo:
Não, têm sido muito positivos. A única questão que nos têm apontado é realmente o facto de sermos só os dois. Ainda é uma fase muito inicial e que temos de nos desenvolver. E nós temos noção disso.
Fabiana: É o que nos têm apontado mais, o facto de sermos só duas pessoas.

Comentários