Werden bestimmte Begriffe bei Suchen ignoriert?

I’m having a few difficulties with the search functionality today.

We have an automated process we creates topics based on a lecture from a course, an example may be;

About ‘Implementing Health & Damage’

I found myself wanting to reduces the maximum number of characters for a topic length and decide I’d do a quick search to see how many of our automated topics are quite long, to get a feel for the suitable max length.

If I search using the above, I’ll get result, but I need the search to be a little more general than that, so I’ve tried searching for;

About ’

…knowing that is the start of the format we always use. When I do, I don’t get any results, if I add another word after the apostrophe I do get results. I assumed at that point it was related to the apostrophe, but nope, if I search for just;

About

I get no results, yet if I search for;

Test

I do get results! This indicates there isn’t a limitation on the number of words as a minimum for a search, and we have a 3 character limit set for the term, so it isn’t that. The only thing I can think of is that there is a list of “words” that are being ignored from a search, yet I don’t think we’ve set these up.

Any information would be appreciated. :slight_smile:


Update

I have also tested this with “because”, “and”, “the” and these all produce no results, so I’m feeling that there is a list of “common words” which are being ignored, but because I don’t have access to these via the settings I cannot alter them, and, cannot perform the search I want to perform.

Yes, I believe these are “stop” words — see:

I’m not sure if things have changed much since two years ago, but there doesn’t seem to be an easy way to change those.

8 „Gefällt mir“

Hi Kris,

Thanks for the reply.

Yeah, I thought as much. It’s a pain on this occasion as in this specific case the word does have value.

I guess using DataExplorer wouldn’t get around this either?


Update

Actually, via DataExplorer it works. I guess a full text search isn’t carried out when querying the topic title field.

Looks like a work-around :slight_smile:

7 „Gefällt mir“

Ich bin gerade selbst darauf gestoßen. Es ist … extrem ärgerlich. Gibt es ein Update oder eine Möglichkeit, das jetzt zu ändern? „About

1 „Gefällt mir“

Ich bin auch überrascht, dass „about

1 „Gefällt mir“

Danke, Jeff, ich wusste nicht, dass man nach angepinnten Themen suchen kann. Bei Discourse-Funktionen gibt es immer wieder etwas Coolen und Neues zu entdecken. :smiley:

Aber… hast du schon Gedanken dazu, wie man den armen Nutzer warnen könnte, der sucht und nichts findet, obwohl er weiß, dass es Ergebnisse geben müsste? Jetzt, wo ich die vollständige Liste sehe, ist sie wirklich ziemlich lang…

2 „Gefällt mir“

Es ist eine gute Idee, eine Warnung auszugeben, wenn deine Suche nur aus Stoppwörtern besteht. Wie aufwendig wäre das umzusetzen, @tgxworld?

Wir möchten die Liste nicht hart codieren, daher benötigen wir eine Möglichkeit, PostgreSQL abzufragen und zu prüfen: „Sind all diese Wörter Stoppwörter?"

3 „Gefällt mir“

Wir können eine zusätzliche Spalte in unserer Suchabfrage zurückgeben, die uns ermöglicht zu erkennen, ob der Begriff ausschließlich aus Stoppwörtern besteht. Das ist nicht sehr schwer umzusetzen. Ich muss jedoch noch tiefer einsteigen, um herauszufinden, wo genau diese zusätzliche Spalte eingefügt werden muss. Unser Endziel sollte jedoch sein, eine zusätzliche Datenbankabfrage zu vermeiden, nur um festzustellen, ob ein Begriff ausschließlich aus Stoppwörtern besteht oder nicht.

2 „Gefällt mir“

Vielleicht führen wir diese Prüfung nur dann durch, wenn keine Suchergebnisse vorliegen, um zu prüfen, ob die Abfrage ausschließlich aus Stoppwörtern besteht? Dann würden wir nur dann eine zusätzliche Prüfung durchführen, wenn die Ergebnisse ohnehin schlecht sind. Gemäß der Stoppwortliste wäre das beispielsweise der Fall, wenn Sie nach „doing should now

2 „Gefällt mir“

Genau, ähnlich wie ich es mit der zusätzlichen Spalte in den Suchergebnissen gemeint habe. Wenn die Suche leer ist, prüfen wir die Spalte, um festzustellen, ob dies daran liegt, dass alle Begriffe Stoppwörter sind, oder weil wir keine Treffer erhalten haben.

2 „Gefällt mir“

Wie funktionieren diese Stoppwörter in anderen Sprachen? Werden übersetzte ebenfalls gestoppt? Oder nur englische, wenn diese für technische Zwecke benötigt werden?

Es gibt Dateien für verschiedene Sprachen

2 „Gefällt mir“

Ich verstehe. Fast alle Personalpronomen in fast allen Formen, und mit dem Verb sein, plus ein paar Füllwörter wie oder, nur, wann usw. Fast alles kann in der Suche umgangen werden, zum Beispiel brauchen wir hauptsächlich keine Personen in einem Satz. Aber sicher, das hält die Datenbank besser kontrollierbar.

Aber gut zu wissen, dass sie auch sprachspezifisch aufgebaut ist. Danke.

2 „Gefällt mir“