Ferramenta que gera artigos de outros sites

A alguns dias atrás eu estava pensando em desenvolver uma ferramenta capaz de me trazer  o conteúdo publicado de algum blog da minha escolha. Pois desta forma eu poderia capturar as últimas postagens de outros sites para organiza-los e posta-los em algum outro site. Diante disso, minha ideia principal era conseguir criar um novo blog que fosse capaz de publicar conteúdo automaticamente.

A ideia até que foi adiante e eu consegui criar um blog que faz postagens automáticas. Este blog funciona até hoje e isso já faz mais de um ano. Nesta URL aqui: https://fofocas.mksoft.com.br/ você pode acompanhar as últimas postagens feitas de forma automática.

Porém, mais de um ano depois eu me lembrei deste site e imaginei em ir além. Pois no site mencionado eu apenas capturo uma breve introdução do artigo, seu título e imagem de destaque para publicar.  Desta vez eu gostaria de capturar o texto inteiro da postagem e além disso gostaria que eu pudesse converter o texto para outra língua se necessário. Pois partindo disso, eu poderia capturar artigos em outros idiomas para publicar como se fosse em português.

Iniciando o projeto

Para fazer isso eu havia planejado de início eu mesmo escrever um script capaz de fazer o scrap de uma página alvo. Mas após pensar muito em como poderia ser feito, eu tive a ideia de pesquisar antes se havia alguma coisa pronta na qual eu pudesse usar. E foi aí que eu encontrei esta maravilha de script aqui https://github.com/crscheid/php-article-extractor. Com ela eu rapidamente fui capaz de conseguir extrair dados de praticamente qualquer artigo que eu quisesse apenas passando a URL. Este script é muito superior a qualquer coisa que eu pudesse desenvolver se tomasse a decisão de criar o scrap sozinho. Ainda bem que eu decidi pesquisar por algo antes.

Bem! Após baixar este script e integra-lo ao meu projeto, eu precisei pesquisar por alguma forma de conseguir traduzir o texto capturado. Como eu já tenho uma certa experiência com o Google App Script, eu decidi que desenvolveria o tradutor pela API do Google tradutor.

Com poucas pesquisas e poucas linhas de código eu fui capaz de criar uma simples API que recebia um texto qualquer e a traduzia para qualquer outro idioma que o Google suportasse. Então, uma vez que isso já estava funcionando eu o integrei com o meu código PHP que fazia o uso do script que encontrei no git.

O empacotei num projeto só e o defini como uma API no endereço: https://api.mksoft.com.br/article.extractor/v1. Tudo que este endpoint faz é receber uma requisição POST com os devidos parâmetros para computar a extração do artigo selecionado e após isso, submeter todo este texto para a API de tradução.

Dessa forma os dados são retornados no idioma que eu escolhi.

A ferramenta que extrai artigos

Com isso em mãos eu decidi montar uma versão prática no endereço: https://geradordeartigos.mksoft.com.br/.

Aqui qualquer pessoa poderá através de uma URL, requisitar o conteúdo de um artigo num idioma desejado. A ferramenta será grátis e acredito que ajudará a quem deseja puxar um conteúdo traduzido ou modificado para outro idioma de forma simples e fácil.

Além disso, este projeto está em fase beta. É bem provável que eu vá ajustando alguns detalhes que faltam neste ferramenta grátis ao longo do tempo.

Objetivos finais

Como eu disse no início, o meu objetivo com este script é conseguir criar um blog no piloto automático. Então os próximos passos adiante serão em volta de construir um blog que se alimente deste conteúdo de forma autônoma. A minha ideia é de traduzir diversos artigos de outros idiomas e publicar no meu site automático só pra ver o que que acontece ao longo do tempo. Tenho curiosidade de saber se um site feito desta forma conseguiria ganhar relevância na internet a ponto de poder fazer dinheiro com o Google Adsense ou qualquer outra ferramenta ed Ads.

 

Loading