Probleme mit der Zuordnung von Sendungen mit Doppelpunkt im Namen

Ich habe Probleme, Serien mit Doppelpunkten im Titel auf TheTVDB.com zuzuordnen.

Beispiel: „H20:The Molecule That Made Us“ hat bei TheTVDB.com die Serien-ID 380647.
Da „:“ (Doppelpunkt) in Windows (und möglicherweise auch in anderen Dateisystemen) kein gültiges Dateinamenzeichen ist, wird er aus dem Aufnahmedateinamen entfernt – z. B. beim HDHR DVR. Dabei wird auch das „O“ in H2O kleingeschrieben, was aber kein Problem darstellt; wenn es passt, ist alles in Ordnung.

Mir scheint, dass der Doppelpunkt („:“) auch aus den Metadaten entfernt wird.
Ich weiß nicht, wie man bei TheTVDB.com suchen soll, wenn man nicht weiß, dass ein fehlender Doppelpunkt die Zuordnung verhindert, oder ob man in der Suche Platzhalter oder „beliebiges Zeichen“-Markierungen verwenden kann.

In Regex vielleicht bei einem fehlgeschlagenen Match „H2O? The Molecule That Made Us“ versuchen, oder ob man durch Entfernen von Wörtern am Anfang eine Übereinstimmung erhält, z. B. würde „The Molecule that Made Us“ einen Treffer liefern. Ich überlege nur laut aus dem, was ich versucht habe, um manuell in der Plex-Suche eine Übereinstimmung zu bekommen.

Es wäre schön, wenn man feststellen könnte, dass im Titel ein Doppelpunkt fehlt, und bei keinem Treffer mit dem Doppelpunkt nachzuschlagen würde. TheTVDB.com könnte meiner Meinung nach auch besser werden, indem es Interpunktion in Titeln weglässt, um Treffer zu erweitern, oder eine sekundäre Suche ohne Interpunktion erlaubt, um zu prüfen, ob das einen Treffer liefert.

Ich habe dasselbe Problem mit „Power Trip: The Story of Energy“.
Ohne Doppelpunkt gibt es keine Übereinstimmung; nur mit dem Doppelpunkt klappt es.
Und dabei müsste man dieselbe „versuche mit beliebigem Zeichen“-Methode wiederholen, aber es findet erst beim zweiten Wort statt. Gleiches gilt, wenn man Wörter am Anfang weglässt, um einen Treffer zu finden. Das Problem ist, dass man nicht weiß, wo sich der Doppelpunkt befindet, der die Suche blockiert.

Gibt es Hinweise in den HDHR-Metadaten, die helfen können, den fehlenden Doppelpunkt/die fehlende Interpunktion zu erkennen, und bei einem fehlgeschlagenen Lookup erneut mit dem fehlenden Zeichen zu suchen?

Nur ein wenig Gemecker darüber, dass manuell zuzuordnen nötig ist – aber falls es einen Weg gibt…

MCEBuddy versucht zwar, eine Übereinstimmung nach dem Entfernen von Sonderzeichen zu finden, aber YMMV. Wenn du die Logs hast, könnte ich versuchen, es zu reproduzieren.

Es geht nicht darum, die Sonderzeichen zu entfernen. Es geht darum, sie wieder einzufügen. :wink:
Ich denke, das war die Ursache für Probleme bei Sendungen, die Anführungszeichen und Apostrophe in ihren Titeln haben, und manche TV-Programmdienste verwendeten die geraden Anführungszeichen, andere die „schlauen“ (öffnende und schließende) Zeichen – und weil die Übereinstimmung nicht exakt war, musste ich Korrekturen in MCEBuddy einbauen, um die Serien-IDs von TheTVDB.com zu erzwingen (America’s Test Kitchen und Cook’s Country usw.).

Ich werde versuchen, ein Log zu posten. Erledigt am 05/09. Linky

Notizen beim Durchsehen der Log-Datei:
Geringfügig: Es gibt einige inkonsistente Zeilenenden. Nicht alle Zeilen enden mit ^M^L (CR-LF).
Da ist Folgendes:

--> Extracted SiliconDust tags:
Title: Power Trip: The Story of Energy
:
IMDB Id: 
MovieDB Id: 
TVDB Id: 
Is Movie: False
Is Sports: False
:
2020-05-07T02:33:57 MCEBuddy.MetaData.VideoMetaData --> Video Tags extracted -> 
Title: Power Trip: The Story of Energy

Vielleicht könntest du also in TheTVDB (und anderen Quellen) suchen, wenn die Suche über den Dateinamen keine Treffer liefert. Außerdem: Werden die Überschreibungen mit dem Dateinamen, dem in den Metadaten angezeigten „Title“ oder mit beiden abgeglichen?

OK, jetzt wird es seltsam. Die Serie wird jetzt gefunden. Ich vermute, dass sie, weil sie neu ist, erst nach meiner ersten Aufnahme der ersten Episode zu TheTVDB hinzugefügt wurde – bevor ich diese dritte Episode aufnahm.

TVDB Id: 381292

Als ich sie jedoch manuell in der Plex-„Match“-Suche in TheTVDB eingab, fand sie ohne Doppelpunkt keinen Treffer, mit Doppelpunkt schon. Hmmm.

Jetzt bin ich mir nicht mehr sicher, ob es ein Problem gibt. MCEBuddy scheint die Serie in TheTVDB zu finden.
Danke, dass du dir Zeit genommen hast zu helfen, @Goose.

Ich habe nachgesehen, und es funktioniert einwandfrei. Das Problem ist nicht das :, sondern dass es sich um eine Serie mit nur einem Titel handelt und nichts anderem zum Abgleichen – kein Untertitel, kein Ausstrahlungsdatum, keine Episodennummer usw.

Könnte es sein, dass du bei TheTVDB mit dem Titel „Sonderzeichen entfernt“ (ohne Doppelpunkt) bzw. dem ursprünglichen Dateinamen gesucht hast und nicht mit dem tatsächlichen Titel (mit Doppelpunkt) aus den Metadaten? Oder suchst du beide Varianten und der erste Treffer gewinnt?

Ich frage, weil fast alle Serien, bei denen kaum Guide-Metadaten vorhanden sind, PBS-OTA-Quellen sind und die Guide-Daten, die bei TheTVDB, IMDB usw. landen, von Fans kommen. PBS ist nicht wie die großen Networks oder Studios, die Marketingteams haben, die sicherstellen, dass ihre Seriendaten weit verbreitet und gepflegt sind.

Dann gibt es noch das Problem von „gelöschten“ und „sauber gewaschenen“ Inhalten (inklusive Metadaten) nach Skandalen – etwa die Kochsendungen von Martha Stewart, Paula Deen, Mario Batali, John Besh, 15 Staffeln Chris Kimballs ATK/Cook’s Country usw.

PBS/APB hat auch bei älteren Sendungen keine guten Metadaten, besonders beim Create-Kanal, weil die Formate um eine bestimmte Persönlichkeit/Koch/Star kreisen und das Marketing früher bei den unabhängigen Produzenten lag, bevor Streaming und die Pflege der Episoden-Metadaten in TheTVDB oder IMDB (noch weniger, nachdem Amazon übernahm und sie monetarisierte) für den Verkauf der DVDs oder das Streaming on Demand bzw. das Kuratieren privater Mediatheken so wichtig wurden. Beispiele sind alte Sendungen von John Folse, Steven Reichlen (Project Smoke, BBQ-U usw.) oder kostenpflichtige Formate von Food Network oder HGTV.

Ich habe dein Setup nachgestellt und den Titel aus den Metadaten mit dem Doppelpunkt übernommen.

Dein Problem liegt nicht an Sonderzeichen – deine Metadaten enthalten nicht genug Informationen für eine Übereinstimmung. Siehe meinen Kommentar oben:

Du brauchst zwei Informationen, um eine Übereinstimmung zu erzielen.

Das Ausstrahlungs- und Aufnahmedatum steht im Dateinamen – es ist eine HDHR-Aufnahme. Wie kann es sein, dass ich nur nach Namen auf TheTVDB suchen kann und sofort eine Serien-ID bekomme?

MCEBuddy findet jetzt beide Serien, also kein Problem. Ich werde nach einer weiteren Aufnahme schauen, ob es noch vorkommt.

Kein Problem. Mir geht’s gut.

Wenn es wieder passiert, speichere die Logs, damit wir einen ordentlichen Blick darauf werfen können.
Beim Zuordnen einer Serie erwartet sie einen Titel und Untertitel (Episode). Dokumentationen haben keine Episoden, daher liefert TVDB keine Übereinstimmung, wenn MCEBuddy versucht, das Ausstrahlungsdatum zuzuordnen.

Werde ich machen. Leider werden alle Dokumentationen, die ich aufnehme, in mehreren Teilen – also „Episoden“ – ausgestrahlt. Meistens drei oder vier, manchmal aber auch mehr. Zum Beispiel Ken Burns über Baseball, Jazz, Country Music, Nationalparks usw. Und diese hier über Macht hat drei Teile.

Ich werde versuchen, das Aufnehmen zu erwischen.