dtsOptions2::unicodeFilterWordOverlapAmount Data Member

You are here: C++ API

C++ Support Classes

Using the dtSearch Engine with C++

Using the dtSearch Engine with C++ (Linux)

Language Analyzer API

External Thesaurus API

File Parser API

Structs, Records, Enums

> dtsOptions2 Structure > dtsOptions2::unicodeFilterWordOverlapAmount Data Member

dtsOptions2::alphabetFile Data Member

dtsOptions2::autoFilterSizeMB Data Member

dtsOptions2::binaryFiles Data Member

dtsOptions2::binaryFilterTextChars Data Member

dtsOptions2::booleanConnectors Data Member

dtsOptions2::fieldFlags Data Member

dtsOptions2::fileTypeTableFile Data Member

dtsOptions2::fuzzyChar Data Member

dtsOptions2::homeDir Data Member

dtsOptions2::hyphens Data Member

dtsOptions2::indexNumbers Data Member

dtsOptions2::macroChar Data Member

dtsOptions2::matchDigitChar Data Member

dtsOptions2::maxFieldNesting Data Member

dtsOptions2::maxStoredFieldSize Data Member

dtsOptions2::maxWordLength Data Member

dtsOptions2::maxWordsToRetrieve Data Member

dtsOptions2::noiseWordFile Data Member

dtsOptions2::pAnalyzer Data Member

dtsOptions2::phonicChar Data Member

dtsOptions2::privateDir Data Member

dtsOptions2::segmentationRulesFile Data Member

dtsOptions2::stemmingChar Data Member

dtsOptions2::stemmingRulesFile Data Member

dtsOptions2::storedFieldDelimiterChar Data Member

dtsOptions2::synonymChar Data Member

dtsOptions2::tempFileDir Data Member

dtsOptions2::textFieldsFile Data Member

dtsOptions2::textFlags Data Member

dtsOptions2::titleSize Data Member

dtsOptions2::unicodeFilterBlockSize Data Member

dtsOptions2::unicodeFilterFlags Data Member

dtsOptions2::unicodeFilterMinTextSize Data Member

dtsOptions2::unicodeFilterRanges Data Member

dtsOptions2::unicodeFilterWordOverlapAmount Data Member

dtsOptions2::updateFiles Data Member

dtsOptions2::userThesaurusFile Data Member

dtsOptions2::weightChar Data Member

dtsOptions2::xmlIgnoreTags Data Member

dtsOptions2::copy Method

dtsOptions2::copyFixedSizeValues Method

dtsOptions2::equals Method

dtsOptions2::validate Method

Close

dtSearch Text Retrieval Engine Programmer's Reference

Contents|Index|Home

Previous|Up|Next

dtsOptions2::unicodeFilterWordOverlapAmount Data Member

Amount of overlap when automatically breaking words when applying the Unicode Filtering algorithm.

dtsOptions2 Structure

Syntax

C++

int unicodeFilterWordOverlapAmount;

Structure

dtsOptions2 Structure

Remarks

Unicode Filtering can automatically break long runs of letters into words each time more than Options.MaxWordLength consecutive letters are found. By default, a word break is inserted and the next word starts with the following character. Set UnicodeFilterWordOverlapAmount and also set the dtsoUfAutoWordBreakOverlapWords flag in UnicodeFilterFlags to start the next word before the end of the previous word.

For example, suppose the maximum word length is set to 8, and the following run of letters is found: aaaaahiddenaaaaa. By default, this would be indexed as aaaaahid and denaaaa, which means that a search for *hidden* would not find it. With a word overlap of 4, this would be indexed as: aaaaahid, ahiddena, denaaaaa which would allow the embedded word "hidden" to be found in a search for *hidden*.

See Also

Filtering Options