Полностраничный семантический поиск доступен только на английском?

Я провёл немного тестов — извините, не очень последовательно, но скакал как заяц между фарами автомобиля.

Он определённо поддерживает и финский. Думаю, здесь есть более фундаментальные проблемы, связанные с ИИ и малыми языками. А также с пользователями.

Прежде всего, у OpenAI недостаточно материалов для обработки финского языка, но я уверен, что эта ситуация касается всех языков, по которым нет достаточного объёма данных, чтобы ИИ мог украсть использовать их для обучения. Это означает, что семантика — задача гораздо более сложная, чем другие вопросы, и они действительно трудны для ChatGPT при использовании языков, отличных от английского или других крупных языков.

Похоже, что GPT-4 точнее, чем GPT-3.5-turbo. Но если у 3.5 попадания были просто шумом примерно в 8 случаях из 10, и даже Discourse мог предложить те же 2 правильных результата, просто используя чистые теги, то у GPT-4 процент успеха составлял около 50%. И да, это статистика Стетсона.

Создание поиска, где семантический подход… полезен, на самом деле довольно сложно. По крайней мере, для меня, потому что у меня были ожидания относительно того, что я должен получить. Так что дело не только в реальном семантическом поиске, но и в поиске с использованием неточного поискового запроса по списку поисковых терминов, созданных на основе этого запроса. Да, я знаю — это тоже семантический поиск.

Моя самая слабая сторона в том, что семантический компонент работает как положено, но проблемы возникают из-за ограничений самого ИИ и слишком высоких ожиданий пользователей. И язык, отличный от английского, сам по себе не является проблемой.

Но…

Полнотекстовый семантический поиск ужасно медленный. Прав ли я, если обвиню технические слабости моего VPS — недостаточно оперативной памяти, магические существа и т. д.? Потому что здесь всё работает быстро.

Во-вторых… можем ли мы в какой-то момент предлагать результаты от ИИ по умолчанию вместо тех, что генерирует Discourse?