2 de julho de 2025

O dia que eu fiz um epub

Eu gosto de ler. Acho que já deu pra perceber pelo tanto de vezes que falei nos últimos tempos que, no ano passado, eu consegui ler 50 livros. Porém, muitas das coisas que tenho interesse em ler são as famosas novels chinesas, que são publicadas em sites que são uma espécie de wattpad chinês, então eu não tenho como acessar essas novels pelo meu Kindle (que virou meu modo preferido de leitura (na realidade eu sempre preferi ler no digital, já li muitos livros no computador, celular e tablet, mas um e-reader é definitivamente a melhor experiência)).

Até aí tudo bem porque, apesar de eu estudar há mais de 5 anos, eu não sei ler chinês. O meu nível de chinês é bastante básico, pra se virar numa viagem e só, então acabo contando com a boa vontade de tradutores amadores para ter acesso a essas novels.

E aí que tá a questão: esses tradutores não compartilham essas novels em um formato legal como .epub, ou até mesmo .pdf tava bom. Não, não, eles postam cada capítulo em um blog! Ou seja, uma novel é composta por diversas postagens, e se eu quisesse ler no Kindle, eu teria que ir lá, com toda a calma do mundo, copiar uma a uma e colar num editor de .epub. Entendo que os tradutores fazem isso por diversos motivos, dentre eles impedir (ou ao menos dificultar) o compartilhamento do seu trabalho sem os devidos créditos ou até mesmo ver pessoas cobrando pelo seu trabalho, e acho que os tradutores estão certos. Mas ai, pobre de mim, que só quero ler no meu Kindlezinho...

Eis que eu descobri que o meu problema era um não-problema. No sentido de que eu poderia, sim, conseguir fazer um .epub pra mandar pro Kindle. Eu só precisava da ajuda de uma cobrinha querida... Me aventurei novamente em Python!

Com a ajuda de uma biblioteca chamada Selenium, eu consegui fazer um script para extrair os textos das postagens e salvá-los em arquivos .txt de forma automática, sem precisar ficar entrando em cada página, copiando e colando o conteúdo. Aqui vale lembrar que o .epub nada mais é do que uma espécie de pasta comprimida com vários arquivos dentro, e cada capítulo de um livro é um arquivo dentro dessa pastinha, mas esses arquivos são no formato .html (ou .xhtml). Por isso, eu precisava converter o .txt para .html, e até aí é moleza, né? A questão é que o .txt não tem formatação nenhuma, enquanto o .html é um arquivo cheio de tags para formatar corretamente o conteúdo. Como resolver isso?

Python de novo, oras! Mais um mini scriptzinho e consegui converter todos os arquivos .txt em .html com as tags tudo certinho! A partir daí foi só abrir o Sigil, um programa open-source de edição de epubs, importar os arquivos, polir a formatação dos capítulos, criar o sumário, colocar a capa e voilà!

Agora poderei ler uma novel que estou querendo ler há muito tempo porém acabava sempre deixando pra lá porque só podia ler no site dos tradutores. E, antes que perguntem, eu não vou de forma alguma disponibilizar o arquivo para ninguém. Fiz isso apenas para o meu conforto e respeito o trabalho dos tradutores!

(Gostaria de dedicar este último parágrafo para agradecer minha amiga Ceci pela ajuda com Python, essa ideia não teria se tornado realidade se não fosse por ela!)

6 comentários

  1. eu amo esse fenômeno de usar código pra resolver um trabalhão nosso, viva a tecnologia!! nunca precisei fazer um epub mas já te agradeço por "ensinar" caso um dia eu precise. e ah, boa leitura!!

    ResponderExcluir
  2. sempre que leio uma postagem sua falando de python te vejo como uma mega hacker (sei que não é nem de longe isso)
    mas acho legal como voce se aventura e resolve seus problemas!!

    ResponderExcluir
  3. Achei incrível como você resolveu um problema tão específico de forma prática e criativa. E com Python ainda! (Eu não sei nada). Eu jamais teria pensado nisso, muito menos me aventurado a escrever script.
    Não sou muito de ler, mas sempre fico pensando que ter um Kindle talvez me ajudasse a criar mais o hábito. Ver esse tipo de solução me anima, porque parece tornar tudo mais acessível e confortável. Quem sabe um dia eu não tento também?

    Beijos!

    ResponderExcluir
  4. Nossa, eu jurava que eu tinha comentado este post em específico.
    Agora que você fez seu primeiro epub (de uma forma que deixou minha parte ciência de dados emocionada, quero ser assim quando crescer), nada mais te para hahahah
    Achei o layout novo muito fofinho! Deu um sentimento de estar de férias num lugar com praia.
    Se cuida, Maria!
    Kisus :*

    ResponderExcluir
  5. A praticidade venceu, agora vai ficar bem melhor seguir com a leitura
    beijos ♥ blog | insta

    ResponderExcluir
  6. yeey! que massa! pior que python é perfeito né, dá pra fazer muita coisa... mas fiquei curioso, em quais sites existem esses textos originais que tu queria extrair? pois dependendo da arquitetura do site, dá pra criar um python que extraia o texto, preserve e converta algumas tags interessantes e já gere um arquivo .epub e traduzido.

    ResponderExcluir