Se você já tentou alimentar um modelo de linguagem (LLM) com conteúdo de um site, conhece a dor. O processo é quase sempre o mesmo: copiar, colar, e depois passar horas limpando um HTML caótico, cheio de anúncios, menus, rodapés e scripts que não servem para nada. É um trabalho manual, repetitivo e que drena a produtividade de qualquer projeto de IA.
Eu passei por isso vezes demais. Cansado de reinventar a roda a cada novo projeto, decidi criar a solução definitiva para esse problema. É com muito orgulho que apresento o Web to AI.
O que é o Web to AI?
O Web to AI é uma ferramenta online que desenvolvi para transformar qualquer site em dados limpos e estruturados, prontos para treinar modelos de IA. A premissa é simples: você insere uma URL, define a profundidade do crawling, e a plataforma cuida de todo o trabalho sujo.
Em segundos, ela entrega o conteúdo em formato Markdown, otimizado e livre de ruídos, com mais de 95% de precisão na extração.
Os Pilares do Projeto:
Desde o início, o projeto foi guiado por três princípios que definem meu trabalho:
A Tecnologia por Trás da Mágica
Para os curiosos, o backend foi construído com a agilidade do Bun, utilizando seu driver nativo de alta performance para SQLite. Isso garante que a aplicação seja incrivelmente rápida e leve, hospedada de forma eficiente na Fly.io.
Experimente e Me Dê seu Feedback
O Web to AI foi construído para resolver uma dor real de desenvolvedores e pesquisadores de IA. Agora, quero que ele resolva a sua.
Acesse a ferramenta, teste com diferentes sites e me diga o que achou. O feedback da comunidade é o que vai guiar os próximos passos deste projeto.