すべての投稿を再ベイクする際の潜在的な問題の回避方法

こんにちは!

さまざまな理由から、すべての投稿を再ベイクすることが推奨される場合があります。

私自身の再ベイク体験で問題が発生し、他の潜在的な問題も確認・予測できたことから、それらを回避する方法を知りたいです。

  • 200万件の投稿を再ベイクすると、YouTubeへのリクエストが多すぎるとトリガーされ、私のIPがブラックリストに登録される可能性があり、Discourseがプレビューを生成できなくなります。

  • Onebox(Discourseデータベースにタイトル、サムネイル、抜粋がコピーされている - cookedフィールド)の元のURLが無効になったりリダイレクトされたりした場合、Oneboxが壊れ、この情報が失われるように思われます。

  • 古いFacebookとInstagramのOneboxはきれいに表示されていました。現在では表示されません(iframeで表示されます。このコミットを参照)。追加情報:Instagram embedding features and layout これは公開リンクです)

  • いくつかの理由で、私のフォーラムでのFacebook(したがって私の知る限りInstagram)のサポートを中止することにしました。すべての投稿を再ベイクすると、以前は正常にOneboxされていたすべてのリンクが壊れると推測しています。それは正しいですか?

これらの問題の一部を回避するために、"Onebox Assistant", crawl for those previews reliably! が役立つかもしれませんが、すべてではありません。たとえば、Facebookのプレビューには役立ちませんでした。


再ベイク中に既存のOnebox情報を保持するために何ができますか?

「いいね!」 8

再ベイクを強化して、より慎重にする必要があると感じています。

  • 選択したサイト、またはすべてのサイトでのレート制限
  • 何らかの理由で再フェッチが失敗した場合に元のoneboxを継承する

言い換えれば、少なくとも選択可能なオプションとして、損傷のない再ベイクが必要だと思います。

(最新の404を重視するDiscourseコミュニティや、古い投稿をまったく重視しないコミュニティもありますが、古いスレッドをそのまま維持したいと強く願うコミュニティもあります。)

「いいね!」 4

これを言い換えて、機能リクエストとして再分類することは可能でしょうか?

「いいね!」 1

ツイートのコンテンツを自動的に再取得することに、何か意味はありますか?ボックスがチェックされない限り、ワンボックスのコンテンツを再度取得するのをスキップしても構いません。

「いいね!」 2

それは良い考えですね。より堅牢で、レート制限の問題に陥りにくいでしょう。指定がない限り、すべてのワンボックスはそのままにしておいてください。

「いいね!」 1

投稿ありがとうございます。私が取り組んでいることに影響が出る可能性があります。制限をトリガーするのにいくつのリクエストが必要か、何かお分かりになりますか?

YouTube APIのドキュメントを見ると、APIキーを使用して行われたリクエストは24時間あたり最大10,000件のGETリクエストが許可されているようですが、これはAPIキーを使用したリクエストの場合です: YouTube Data API Overview  |  Google for Developers

iframe経由で再生される動画にはレート制限が適用されていないと思いますが、確認しておくと良いでしょう: https://developers.google.com/youtube/iframe_api_reference。

わかりません。

APIなしでOnebox Assistantを使用して問題を解決しました。プラグインが有効になっているだけです。それがどのように問題を解決したのか、私にもわかりません。現在でも機能するかどうかもわかりません。

「いいね!」 2