節目名稱中帶有冒號的匹配問題

我在比對含有冒號的節目名稱與 TheTVDB.com 時遇到問題。

範例:「H2O: The Molecule That Made Us」在 TheTVDB.com 的系列 ID 是 380647。
由於「:」(冒號)在 Windows(可能還有其他檔案系統)中不是合法檔名字元,因此會從錄影檔名中移除。例如 HDHR DVR 就會把它拿掉,還會把 H2O 的 O 變小寫,但這不是問題,只要能比對成功即可。

對我來說,看起來冒號(「:」)也從詮釋資料中被移除了。
我不知道在不知道缺少「:」而導致比對失敗的情況下,要怎麼搜尋 TheTVDB.com,也不確定能否在搜尋中使用萬用字元或任意字元標記。

在 regex 裡,或許在比對失敗時,可試著用「H2O? The Molecule That Made Us」,或者試著去掉前面的字詞,例如「The Molecule that Made Us」看看能否比對成功。我只是把我在 Plex 手動配對時試過的方法隨口說說。

若能偵測到標題中少了「:」,並在沒有比對結果時自動補上冒號再試一次,那就太好了。我覺得 TheTVDB.com 也可以做得更好,例如忽略標點符號以擴大比對範圍,或允許第二次查詢時忽略標點,看看能否找到結果。

「Power Trip: The Story of Energy」也有同樣問題。
沒有冒號就對不上,只有加上冒號才能比對成功。
這一部你得重複「試任意字元」的步驟,但直到第二個字詞才會成功;同樣地,從前面逐字刪除也會找到,但問題是你不知道是哪個冒號導致搜尋失敗。

HDHR 的詮釋資料裡有沒有任何線索能幫忙偵測缺少的冒號/標點,並在第一次查詢失敗時,自動補上缺少的標點/非 ASCII 字元再試一次?

只是發發牢騷,因為得手動配對。但如果有辦法解決……

MCEBuddy 確實會嘗試在移除特殊字元後進行比對,但效果因人而異(YMMV)。如果你有日誌,我可以試著重現問題。

问题不在于去掉特殊字符,而在于把它们放回去。:wink:
我觉得这就是那些标题里带引号和撇号的节目出问题的根源——有些节目单用直引号,有些用“智能引号”(左右弯引号),因为匹配不精确,我只好在 MCEBuddy 里手动修正,强制指定 TheTVDB.com 的节目 ID(比如《America’s Test Kitchen》和《Cook’s Country》等)。

我看看能不能贴个日志。05/09 已上传。链接

查看日誌檔案時的筆記:
小問題:行結束符號使用不一致,並非所有行都以 ^M^L(CR-LF)結尾。
有這麼一段:

--> Extracted SiliconDust tags:
Title: Power Trip: The Story of Energy
:
IMDB Id: 
MovieDB Id: 
TVDB Id: 
Is Movie: False
Is Sports: False
:
2020-05-07T02:33:57 MCEBuddy.MetaData.VideoMetaData --> Video Tags extracted -> 
Title: Power Trip: The Story of Energy

所以,如果依檔名查不到任何結果,也許可以試著在 TheTVDB(及其他來源)查詢。此外,覆寫規則是比對檔名、metadata 顯示的「title」,還是兩者都比對?

現在怪事發生了:它居然能找到這部劇了。我猜是因為這部劇太新,TheTVDB 在我發現第一集錄製問題後才新增,而在我錄第三集之前,它已經被加進去了。

TVDB Id: 381292

但當我在 Plex 的「配對」搜尋裡手動在 TheTVDB 查詢時,不加冒號就找不到,加了冒號才找得到。嗯……

現在我又不確定到底有沒有問題了。MCEBuddy 似乎能在 TheTVDB 找到這部劇。
感謝你願意幫忙,@Goose

我看了一下,这里运行完全正常。问题不在于:,而在于它只是一个只有标题的系列,没有其他可匹配的内容,没有副标题、播出日期或集数等。

会不会是因为你在 TheTVDB 搜索时用的是“去掉特殊字符”(没有冒号)的标题(或原始文件名),而不是元数据里的真实标题(带冒号)?还是两种都会搜,谁先匹配到就算谁?

我之所以这么问,是因为几乎所有缺少节目指南元数据的节目都来自 PBS 的地面信号源,而 TheTVDB、IMDB 等平台上的指南数据基本靠粉丝手动添加。PBS 不像大型电视网或制片厂那样有营销团队去确保自家节目的指南数据被广泛发布和填充。

此外,还有“被抹除”和“被洗白”的内容(连同元数据一起)在丑闻之后消失的问题,比如 Martha Stewart、Paula Deen、Mario Batali、John Besh 以及 Chris Kimball 主持的 15 季《ATK/Cook’s Country》等烹饪节目。

PBS/APB 在老旧节目的元数据方面同样记录不佳,尤其是在 Create 频道,因为这些节目围绕某位名人/主厨/明星展开,早年的推广工作被丢给独立制作人;那时流媒体尚未兴起,把单集元数据提交到 TheTVDB 或 IMDB(后来甚至被 Amazon 收购并商业化)对 DVD 营销、点播播放或如今的家用媒体库整理尚未显得如此关键。例如 John Folse、Steven Reichlen(《Project Smoke》《BBQ-U》等)的老节目,或是 Food Network、HGTV 的付费节目。

我照你的設定重現了一次,並從 metadata 裡取了含冒號的標題。

你的問題不在於特殊字元,而是你的 metadata 資訊太少,無法產生配對。請看我上面的留言:

你需要兩項資訊才能成功配對。

播出日期和录制日期都在文件名里——这是HDHR的录制。为什么我在TheTVDB上只按名字搜索就能顺利找到对应的系列ID?

MCEBuddy现在能同时匹配两个系列,所以问题不大。我会再留意一下是否还会发生。

没事,我这边没问题。

如果再次發生,請儲存記錄檔,這樣我們才能好好檢視。
在比對影集時,系統預期會有標題與副標題(單集名稱)。紀錄片沒有單集,因此當 MCEBuddy 嘗試比對播出日期時,TVDB 不會回傳相符結果。

好的。不幸的是,我录制的所有纪录片都是分多集播出的,通常3到4集,有时更多,比如肯·伯恩斯关于棒球、爵士乐、乡村音乐、国家公园等作品。这部关于权力的纪录片有3集。

我会看看能否捕捉到它发生的情况。