К вопросу о наименованиях мушек
Предположим есть задача собрать в одну базу большое количество
фотографий мушек из различных источников. Не просто собрать, но и сделать
алфавитный указатель, чтобы максимально облегчить поиск по названию, типу и т.п.
Все бы хорошо, но поскольку никакой общепринятой системы именования не
существует, возникают затруднения, связанные с тем, что в различных каталогах
одна и та-же мушка упоминается с различными именами -
"Royal Wulff" и "Wulff, Royal".
Попытка формализовать приведение различных имен к единому виду выливается
в некий эвристический алгоритм, который решает 90% всех проблем, но
остаются исключения, с которыми он плохо справляется, например с
"Blue Wing Olive". Umpqua в
большинстве случаев использует следующие форматы названия:
название_мушки := [автор_оригинала ]название_оригинала[, цветовая гамма]
пример: Carty's Stonefly Nymph, Olive
или
название_мушки := [автор_оригинала ]название_оригинала[ цветовая гамма][, вязальшик_конкретного_варианта]
пример: Joe's Prawn Orange, Howell's
Перенос цветовой гаммы в конец названия на мой взгляд очень хорошее решение,
если бы не "Red Tag",
"Iron Blue Dun" и подобные. К этому добавляется
задача отличить при обработке название мушки от фамилии автора или
вязальшика, что вносит дополнительные трудности в автоматическую обработку.
Если вместо "Red Tag" сделать "Tag, Red" то ее
могут и не найти, однако она будет рядом с "Tag, Yellow", что
более правильно с точки зрения классификации.
Всё. Не знаю, как вас, а себя я убедил. :-) В моих базах будет "Tag, Red" А как в ваших?
Denis
|
|