Hier is meer achtergrond over waarom ze op mijn lijst staan.
PBS-programma’s ontbreken notoir in elke database. Ze worden uitsluitend via PBS uitgezonden, maar zijn voor het grootste deel onafhankelijke producties en afleveringsgegevens na uitzending zijn meestal alleen beschikbaar op de website van het programma, als die er al is. Vandaar de vermeldingen voor Project Smoke, Project Fire, Emeril, enz. Als het niet in de gidsgegevens staat, staat het er niet.
En op een willekeurige website of zelfs een afleveringsgids is er geen manier om die informatie in een bruikbaar formaat of via een API te verkrijgen. Het is letterlijk extraheren van een webpagina, als het al beschikbaar is. Dus de vermeldingen moeten bijna altijd als correctie in MCE Buddy worden gecodeerd en als er metadata is, is het bijna altijd alleen wat in de gidsgegevens zat die HDHR DVR heeft toegevoegd toen het programma OTA werd opgenomen. Elke YT-, web- of andere bron van de afleveringen is vrijwel kansloos.
Ik zou willen dat er een manier was om handmatig een tekstbestand te maken (JSON, XML, YAML, enz.) en dat opnieuw te kunnen verwerken met MCEBuddy (Custom Cuts?) dat ALLEEN de nieuwe metadata samenvoegt en de streams met rust laat — ik hoef geen demux/mux/transcoding.
De vermeldingen voor ATK en Chris Kimball’s Milk Street Kitchen zijn omdat apostrofs en aanhalingstekens in de gidsgegevens en databases verminkt worden — is het een enkel aanhalingsteken, een apostrof, een sluitend enkel aanhalingsteken en staat het in ASCII of UTF-8 of een andere tekensetcodering, enz. Het is gewoon een puinhoop met speciale tekens — vooral aanhalingstekens (enkel, dubbel, open, sluitend, universeel) en streepjes (koppelteken, em-dash, en-dash). Vandaar het zorgvuldige gebruik van minimale tekstmatching en wildcards om al het vreemde gedoe in de programmanaam te negeren.
Amazing Race en Survivor staan erop omdat ze de seizoensinformatie niet goed kregen en Plex bleef de “eerste” vermelding voor de show kiezen terwijl de show in meerdere talen beschikbaar is. Dus koos Plex altijd Survivor — Albanese editie of een niet-VS-versie van de show.
Ik moet Plex ook vertellen om de mediametadata (die MCEBuddy toevoegt) te prioriteren boven zijn eigen “agent”-opzoekingen in TVDB met terugval op IMDB (vanwege het enorme aantal Plex-gebruikers dat dat doet en IMDB die Plex-gebruikers blokkeert op hun “publieke” API omdat ze geen geld van Plex of hun gebruikers kunnen krijgen om Jeff Bezos nog rijker te maken).
En ik heb waarschijnlijk nog wat opruimwerk te doen voor programma’s die niet meer worden uitgezonden (John Besh, Cobra, Will & Grace).