Une petite mise à jour de rss-bridge, ça vous dit ?

Suite aux mises à jour de Sexactu, j’ai dû réécrire le bridge correspondant, et j’en ai donc profité pour mettre à jour rss-bridge.

Et même si je n’aime pas spécialement le PHP, je dois dire que les choix d’API sont quand même vachement pratiques.

En bonus, avec xampp et Eclipse-PDT, c’est quand même super facile de bosser.

Du coup, j’en ai profité pour mettre à jour tous mes bridges … et évidement les envoyer sur github. Et franchement, c »était facile. Bravo à l’équipe rss-bridge.

Publicités

Lost in NAS

Souvenez-vous, la semaine dernière, j’ai à moitié perdu mon NAS. Où est-ce que j’en suis aujourd’hui ?

NAS unijambiste

Aujourd’hui, mon NAS n’a plus qu’un seul disque dur, et je flippe. J’ai commandé deux disques durs 1 To pour augmenter sa capacité, mais en attendant qu’ils arrivent, j’ai la trouille. Cela dit, je sais déja que je ne jouerai pas l’économie, et que je les installerai en « vrai » RAID 1 sur tout l’espace disque. ca fait que mon NAS passera de 700 Mo utilisables avec une fiabilité faible à 1 To utilisable de façon plus fiable.

Oui, je sais, le RAID n’est pas un backup, mais en l’occurence, il remplit précisément l’usage pour lequel il est conçu : me permettre de vivre avec des moyens limités pendant un temps limité.

Pas de Raspberry alors ?

Effectivement. J’y avais pensé (ou plutôt à l’ODROID). Mais, quand on ajoute au prix de la machine celui des boîtiers USB3/SATA, ça finit par revenir plus cher qu’un NAS. Donc oui, pas de micromachine. En vérité, je commence à me forger l’opinion que ces machines « light » ne sont que très rarement utiles.

Et alors les sites web hébergés ?

J’en ai profité pour faire un peu de ménage : j’ai viré KrissFeed, Codiad, MiniGalNano (je n’utilisais pas les deux derniers), mais conservé rss-bridge et Shaarli. Bon, j’ai bien essayé de les faire tourner sur ma page perso free.fr, mais free n’en est encore qu’à PHP 5.1 … Du coup, je les ai réinstallé sur mon NAS.

Je dois dire que j’ai essayé de ne pas les réinstaller uniquement parce que je crains que ces outils n’aient provoqué la chute du disque en faisant tourner le disque dur en permanence. Mais comme je n’en suis pas du tout sûr … et que j’ai pris des disques avec 18 Mo de cache, j’espère éviter le même problème.

Plus de Krissfeed ?

Mouaip. J’étais assez insatisfait de l’application : je le trouvais lent, je trouvais pénible le besoin de me logger pour que les pages soient rechargées, et encore pire le fait que je sois trop rapidement déloggé. Donc je l’ai remplacé par … rss2imap (version Rui Carno).

Et ma vie a changé.

J’ai pendant longtemps été allergique aux clients RSS lourds (genre RSSOwl), et je ne savais pas pourquoi. Maintenant, je sais : ils réinventent en fait le client mail. Et avoir mes flux RSS bien classés dans des dossiers de mon Thunderbird ou de mon K9-Mail est en fait invraissemblablement chouette. Sauf peut-être pour les messages Twitter … mais c’est un cas particulier. Oh, j’ai bien sûr quelques flux qui foirent (typiquement les bridges RSS de Freenews et The Oatmeal), mais ça va se régler. Et bientôt, j’aurais les images, je le sais.

En bonus, comme c’est du Python et que, tel un Neo de bas étage (moi, citer Matrix, franchement), « je connais le Python« , j’ai déja pu hacker un petit truc.

L’immortalité dans le web

Au passage, Catherine Dufour avait raison de parler des fantômes du web : je lisais le code de rss2imap quand je suis tombé sur cet entête

2016-03-14 15_53_10-rss2imap_html2text.py at master · rcarmo_rss2imap

Aux martyrs, le web reconnaissant

Laissez-moi vous dire que ça fait bizarre pour un fan des flux RSS comme moi de tomber sur du code de l’auteur de la spec, tombé pour la lutte contre le paywall universitaire. Et vous voyez, ce type est peut-être mort, mais son code lui rend hommage. C’est beau.

Et maintenant ?

Oh, je vais sans doute passer à alt-f, le firmware alternatif. Il me permettra d’installer la commande at, qui me permettra à son tour d’exécuter rss2imap directement sur le NAS, ce qui sera un peu plus intelligent que de le faire tourner sur ma machine professionnelle (en y laissant donc la conf IMAP de mon compte)

J’ai bien failli lâcher krissfeed, vous savez …

En ce moment, chaque semaine, je ne sais ni pourquoi ni comment, le fichier data.php se corrompt assez facilement. Et du coup, krissfeed ne marche plus.

Du coup, ça m’a donné une excuse pour faire mon voyage traditionnel dans le monde des lecteurs RSS en ligne. En ligne, parce que je lis mes flux depuis mon portable de bureau, le portable de ma femme, mon ordinateur fixe, et même mon téléphone portable, enfin pas avec krissfeed, puisque les réglages sont partagés entre tous les appareils.

Bref …

J’ai donc jeté un oeil à quelques concurrents

  • commafeed a un look assez sympa, mais certains flux ne se mettaient jamais à jour
  • readerself a l’air chouette, sauf que le paquet de redirections empêche de l’utiliser avec lighttpd (sauf à connaître la syntaxe des redirections dans ce langage, ce qui n’est pas mon cas)

Et puis je suis revenu à krissfeed, qui est juste suffisant pour mon besoin …

Bref, une non-histoire 🙂

Twitter via RSS

Vous savez que Twitter n’a plus de flux RSS accessible pour la « home » d’un utilisateur.

Ben oui, la home, la page qui se charge quand on se connecte à Twitter.

Personnellement, je trouvais ça pénible, mais sans plus.

Et puis Guillaume Laforge a demandé aux castcodeurs comment on s’informait de nos jours sur le web …

Du coup, évidement, j’ai répondu ça

Et hélas, Twitter.
Hélas, parce que Twitter ne me fournit que de minuscules bouts d’information là où j’aimerai avoir plus de matière.
Hélas, parce que Twitter ne me permet pas de classer les sources d’information dans des dossiers, ou selon des tags, ou quelque autre sorte d’organisation.
Hélas, enfin, parce qu’il n’y a pas moyen de savoir quels messages j’ai déja lu.
Hélas, toujours, parce qu’il n’y a pas de flux RSS disponible pour ma timeline complète (c’est-à-dire avec tous les gens que je suis).

Et pourtant, on trouve sur twitter des tas de liens intéressants. Du coup, j’ai cherché un peu des outils permettant de récupérer dans des flux RSS le contenu de ma page twitter … Et j’ai trouvé des trucs, mais difficilement. Cela dit, Pixsy m’a fourni, outre un outil apparement très chouette (mais qui ne marche pas pour twitter), un lien vers tweetledee que j’ai immédiatement installé sur mon serveur PHP local.

Et du coup, j’ai à côté de mon rss-bridge qui me sert très bien un tweetledee au but assez spécifique.

Je n’ai pas réfléchi bien longtemps avant de l’installer. Parce que comme rss-bridge, c’est de l’open-source sans base de données, facile à utiliser, et qui correspond bien au besoin. Evidement, c’aurait été un peu mieux que rss-bridge me fournisse ce service, mais comme il faut passer par OAuth pour se connecter à Twitter, j’imagine que Seb n’y est pas spécialement favorable (et je dois également reconnaître que je n’ai pas eu le courage de coder le truc).

Une liste de course pratique pour rss-bridge

J’aime bien rss-bridge. C’est pratique.

Et comme je veux pouvoir y contribuer un peu plus, j’avais vaguement noté dans les issues github une liste de sites qui pourraient nécessiter un peu de boulot (ah, tiens, non).

Mais c’était pas super pratique.

J’ai donc pris une décision radicale : j’ai créé dans mon kriss-feed un dossier @todo:rss-bridge dans lequel je mets tous les flux pour lesquels je dois écrire un bridge.

Et comme ça, dès qu’un nouvel élément y apparaît, je me rappelle que je dois vraiment bosser dessus.

Et ça se voit bien :

Kriss feed (1)_2014-03-20_17-03-14

Bon, je ne sais pas si ça suffira à me sortir de la procrastination, mais je ne crois pas que ça pourra faire le moindre mal … si ?

Pour l’anecdote, cette histoire de @todo me vient d’un vieil article de lifehacker (qui apparaîtra lui aussi dans cette catégorie). Je m’en sers pour mes différents projets personnels, et c’est bien pratique.

rss-bridge, c’est bien (et le php aussi)

Je vous parlais il y a peu de ma lassitude ce ces flux mal fichus.

J’avais donc installé rss-bridge, et je ne vous avais pas parlé de mes développements à ce sujet.

Et bien maintenant, je peux. Parce que j’ai écrit deux bridges, un facile et un autre un peu moins.

Le facile, c’est évidement Sexactu, pour lequel les articles complets sont toujours disponibles sur la page gqmagazine.com/sexactu, qui réduit donc la transformation à un peu de scrapping HTML, chose pour laquelle mon lifestream m’a poussé à développer quelques compétences. Et donc, c’est assez facile.

Le moins facile, c’est – curieusement – Les 400 Culs pour lequel j’ai dû développer une solution de cache de pages HTML. Tout ça parce que

  1. Il y a des articles tronqués pour lesquels il faut aller sur une autre page pour avoir la version complète
  2. Le FileCache existant dans rss-bridge ne permet pas la mise en cache d’objets quelconques, du moins d’après ce que j’ai compris …

Au-dela de ça, il y a deux ou trois trucs curieux que j’ai constaté, qui me changent du développement Java.

La première est une surprise : comment peut-on livrer une application où on enlève sciement les rapports d’erreur ? Ca n’est pas une critique personnelle, juste une surprise. L’une des toutes premières lignes de rss-bridge est

Du coup, quand on développe un bridge, au début, on ne comprend pas (moi au moins) pourquoi aucun message d’erreur ne s’affiche, et puis on décommente la bonne ligne et là, on peut enfin travailler 🙂

A cette surprise près, travailler avec PHP est en un sens assez agréable parce que la doc est d’une qualité formidable, et qu’en plus il n’y a pas ces phases de compilation/packaging typique du code Java. ca laisse songeur, quand même, de voir que, malgré tous les défauts inhérents au langage (et ils sont nombreux), il est à ce point facile d’écrire un truc qui, en Java (et malgré toutes ses qualités), me prendrait du temps et nécessiterait quelques dépendances (d’un autre côté, c’est ausssi le cas ici puisque rss-bridge dépende  de Simple HTML DOM Parser – qui est du reste un joli bout de code).

Les articles tronqués, ça fait chier

Oui, je suis vulgaire. Mais là, j’ai une bonne raison : regardez donc ce que m’affiche KrissFeed :

Kriss feed (7) - Opera_2014-02-04_17-15-22

Vous croyez vraiment que Maïa Mazaurette va me gonfler à me parler de montres que je ne veux ni ne peux acheter ? Moi non plus, je ne crois pas. Surtout quand la page de Sexactu affiche en réalité cela :

Sexactu _ GQ Magazine _ GQ - Opera_2014-02-04_17-18-26

Article que je n’ai même pas lu, parce qu’il était noyé dans le bruit de GQ.

Tout ça, c’est la faute des flux RSS, et de ceux qui veulent les polluer … Parce que bon, sur cette page, le seul flux RSS indiqué est, évidement, celui du magazine complet (donc avec la fameuse montre pour celui qui n’a rien dans le slip). Donc, il va me falloir une solution … radicale.

Heureusement, SebSauvage est là !

J’avais dans mon Krissfeed son lien Shaarli évoquant par la bande rss-bridge, et je me disais que ce serait peut-être une addition utile … Eh bien maintenant j’en suis sûr : je vais l’installer chez moi et écrire le bout de PHP qui me permettra de récupérer les articles de Sexactu (et sans doute des 400 culs également, puisque j’utilise pour ces deux sites FullTextRSS). Et bien sûr, je partgerai ça sur github (même sis je ne suis pas sûr que ça serve à grand monde :-))

Oh, et en bonus, je crois que je vais m’ajouter les joies du code et ma timeline twitter dans Krissfeed, ce sera pratique.

 

Bon, après install … c’est quand même fastidieux de devoir télécharger le parseur DOM à la main, j’aurais bien aimé qu’un script soit lancé sur ma machine pour le faire … Et puis j’ai pas ma timeline twitter, juste mes messages (oui, je fais le grognon). Bon,c ela dit, ça m’a l’air bien organisé, même si pour l’instant mon Sexactu ne génère rien. On verra plus tard …

Allez pouf un krissfeed

Je dois bien reconnaître que Selfoss présentait bien.

Je dois bien reconnaître que son côté Responsive flattait l’oeil.

Mais franchement, 45 minutes pour mettre à jour mes flux RSS, c’est un peu abusé.

Donc, je l’ai remplacé par un krissfeed, qui présente l’avantage d’avoir un bouton « partager sur mon shaarli ».

Et, pour peu que je mémorise les raccourcis clavier, j’ai bien l’impression que j’arriverai à m’en servir de façon efficace.

Bon, je sais pas encore si je dois remercier SebSauvage pour son commentaire, mais on verra.

Il y a toutefois un problème « classique » : comme mon NAS a son propre serveur web, mon lighttpd tourne sur le port 8080 et est redirigé à la sortie de mon réseau local vers le vrai port HTTP. Et, de temps en temps, certains s’oublient et ajoutent un numéro de port … ce qui fait que, évidement, je n’arrive jamais à accéder à la bonne page. Et ne croyez pas que je vais ouvrir un autre port dans ma freebox !

J’ai pas fini de pester contre la fin de GReader

Parce que bon, Selfoss est un bon lecteur de flux RSS.

Mais la mise à jour marche mal : j’ai régulièrement des blocages du process php qui fait la mise à jour.

Et comme je suis un bien piètre administrateur système Linux, je ne suis pas non plus sûr que le script shell que j’ai écrit pour éviter les exécutions parallèles fonctionne. Du coup j’ai désactivé le cronjob pour revenir à des mises à jour depuis un navigateur web. Je vais peut-être louper des articles de Lifehacker, par exemple … (vu le nombre d’articles qu’ils sortent). Mais au moins, je n’aurai plus à rebooter mon NAS à chaque fois qu’il y a un plantage dans la mise à jour des flux RSS.

Cela dit, si quelqu’un veut m’aider à améliorer le script, je suis preneur 😉

Plus de Google Reader

Bon,
je le dis pour les lecteurs du futur. Google a annoncé la fin de vie de Google Reader pour le 1er juillet prochain.

Du coup, cet ancien article redevient furieusement actuel (comme toutes les interrogations pas forcément spécieuses sur la dillution du « don’t be evil » dans le capitalisme furieux) et évidement les alternatives fleurisent … rapidement.

A l’heure actuelle, the old reader tient fermement la corde (il marche avec tous les navigateurs, contrairement à feedly).  Mais peut-être que je ourrai mettre la main sur un lecteur installable localement, histoire d’arrêter d’être le dindon de leur farce.

Bon, cela dit, Google Reader ne devait pas coûter bien cher à Google … du coup je comprend difficilement les raisons de cet abandon. Mis à part bien sûr si on considère que ces deux outils ne servent qu’un seul et même but : renseigner Google sur ce qu’aiment les internautes et donc pouvoir mieux les cibler.