2 de julho de 2025 -

O dia que eu fiz um epub

Eu gosto de ler. Acho que já deu pra perceber pelo tanto de vezes que falei nos últimos tempos que, no ano passado, eu consegui ler 50 livros. Porém, muitas das coisas que tenho interesse em ler são as famosas novels chinesas, que são publicadas em sites que são uma espécie de wattpad chinês, então eu não tenho como acessar essas novels pelo meu Kindle (que virou meu modo preferido de leitura (na realidade eu sempre preferi ler no digital, já li muitos livros no computador, celular e tablet, mas um e-reader é definitivamente a melhor experiência)).

Até aí tudo bem porque, apesar de eu estudar há mais de 5 anos, eu não sei ler chinês. O meu nível de chinês é bastante básico, pra se virar numa viagem e só, então acabo contando com a boa vontade de tradutores amadores para ter acesso a essas novels.

E aí que tá a questão: esses tradutores não compartilham essas novels em um formato legal como .epub, ou até mesmo .pdf tava bom. Não, não, eles postam cada capítulo em um blog! Ou seja, uma novel é composta por diversas postagens, e se eu quisesse ler no Kindle, eu teria que ir lá, com toda a calma do mundo, copiar uma a uma e colar num editor de .epub. Entendo que os tradutores fazem isso por diversos motivos, dentre eles impedir (ou ao menos dificultar) o compartilhamento do seu trabalho sem os devidos créditos ou até mesmo ver pessoas cobrando pelo seu trabalho, e acho que os tradutores estão certos. Mas ai, pobre de mim, que só quero ler no meu Kindlezinho...

Eis que eu descobri que o meu problema era um não-problema. No sentido de que eu poderia, sim, conseguir fazer um .epub pra mandar pro Kindle. Eu só precisava da ajuda de uma cobrinha querida... Me aventurei novamente em Python!

Com a ajuda de uma biblioteca chamada Selenium, eu consegui fazer um script para extrair os textos das postagens e salvá-los em arquivos .txt de forma automática, sem precisar ficar entrando em cada página, copiando e colando o conteúdo. Aqui vale lembrar que o .epub nada mais é do que uma espécie de pasta comprimida com vários arquivos dentro, e cada capítulo de um livro é um arquivo dentro dessa pastinha, mas esses arquivos são no formato .html (ou .xhtml). Por isso, eu precisava converter o .txt para .html, e até aí é moleza, né? A questão é que o .txt não tem formatação nenhuma, enquanto o .html é um arquivo cheio de tags para formatar corretamente o conteúdo. Como resolver isso?

Python de novo, oras! Mais um mini scriptzinho e consegui converter todos os arquivos .txt em .html com as tags tudo certinho! A partir daí foi só abrir o Sigil, um programa open-source de edição de epubs, importar os arquivos, polir a formatação dos capítulos, criar o sumário, colocar a capa e voilà!

Agora poderei ler uma novel que estou querendo ler há muito tempo porém acabava sempre deixando pra lá porque só podia ler no site dos tradutores. E, antes que perguntem, eu não vou de forma alguma disponibilizar o arquivo para ninguém. Fiz isso apenas para o meu conforto e respeito o trabalho dos tradutores!

(Gostaria de dedicar este último parágrafo para agradecer minha amiga Ceci pela ajuda com Python, essa ideia não teria se tornado realidade se não fosse por ela!)

Nenhum comentário

Postar um comentário