Вход в систему

Классификация

 

КЛАССИФИКАЦИЯ – процесс и результат разбиения всего множества объектов (исследования или наблюдения) на непересекающиеся классы на основании общности признаков классифицируемых объектов. Основные требования, предъявляемые к классификации[1] [1]:

1. Каждая классификация может проводиться только по одному основанию. Это, пожалуй, самое главное требование, наиболее часто нарушаемое. Вводя какую-либо классификацию, сразу необходимо оговорить – а по какому основанию она вводится? Основание классификации – это признак, который дает возможность разделить объем родового понятия (всю совокупность классифицируемых по данной классификации объектов) на виды (видовые понятия – члены, части этой совокупности). Например, основанием для деления общеобразовательной школы на начальную, неполную среднюю и среднюю служит уровень общего образования, даваемый учащимся на каждой ступени. В то же время нельзя, к примеру, в одной классификации разделить учащихся какой-то школы по возрасту и успеваемости или, скажем, посещению факультативных занятий.

2. Объем членов классификации должен быть в точности равен объему всего классифицируемого класса. Это значит, к примеру, что если мы разделили все треугольники на основании величины углов: остроугольные, прямоугольные, тупоугольные, то никаких других треугольников по этому основанию быть не может.

3. Каждый объект может попасть только в один подкласс. Нельзя, например, расклассифицировать все целые числа на четные, нечетные и простые. Тогда числа 5, 7, 11 и т.д. попадают одновременно в два класса – они являются и нечетными и простыми.

4. Члены классификации должны взаимно исключать друг друга; это значит, что ни один из них не должен входить в объем другого. К примеру, научные книги нельзя подразделить на монографии, учебники, справочники и по математике. Книги по математике могут быть и монографиями, учебниками, справочниками.

5. Подразделение на подклассы должно быть непрерывным, то есть необходимо брать ближайший подкласс и не перескакивать в более отдаленный подкласс. Допустим, научные исследования можно классифицировать как исследования в области физики, химии, биологии, экологии и т.д., но нельзя – как исследования в области химии, биологии, экологии и электродинамики (раздел физики). В последнем случае мы «перескочили» из ближайшего подкласса (физика) в более отдаленный подкласс – раздел физики.

Можно еще добавить, что к одному и тому же классу объектов, явлений, процессов могут быть применены разные классификации по разным основаниям-признакам. Так, например, мебель может быть классифицирована:

– по основанию материала, из которого она изготовлена: деревянная, металлическая, пластмассовая и т.д.;

– по основанию стиля дизайна: классическая, ампир, викторианская, модерн и т.д.;

– по основанию цвета: черная, белая, коричневая и т.д.;

– по основанию функционального назначения: столы, стулья, шкафы и т.д.

То есть одни и те же объекты могут быть классифицированы по множеству оснований.

Наконец, отметим, что совокупность классификаций по разным основаниям, для выделения которых, в свою очередь, существуют свои основания, называется системой классификаций [2]. Построение и анализ систем классификаций играют важную роль в научных исследованиях, так как позволяют четко ограничить соответствующую предметную область (которая определяет основание классификации оснований системы классификаций), выделить в этой предметной области взаимосвязанные подобласти, обозначить «белые пятна» – перспективные предметы или методы исследования. Кроме того, исследование всех классов некоторого основания позволяет производить обобщение.

Для решения задач классификации на основе имеющихся экспериментальных данных могут быть использованы статистические методы [3], в которых близких смыслах (в зависимости от предметной области) используются также термины: «группировка», «систематизация», «таксономия», «диагностика», «распознавание образов».

В дискриминантном анализе классы предполагаются заданными (например, обучающими выборками, для элементов которых известно, каким классам они принадлежат: больной-здоровый, легкая степень заболевания – средняя – тяжелая и т.д.). Задача заключается в том, чтобы вновь появляющийся объект отнести к одному из этих классов. У термина «дискриминация» имеется множество синонимов: диагностика (требуется поставить диагноз из конечного списка возможных диагнозов, если известны определенные характеристики пациента и известно, какие диагнозы ставились пациентам, вошедшим в обучающую выборку), распознавание образов с учителем, автоматическая (или статистическая) классификация с учителем и т.д.

Если в дискриминантном анализе классы заданы, то кластеризация и группировка предназначены для выявления и выделения классов. Синонимами являются: построение классификации, таксономия, распознавание образов без учителя, автоматическая классификация без учителя и т.д.

Задача кластерного анализа заключается в выделении по эмпирическим данным резко различающихся групп (кластеров) объектов, которые схожи между собой внутри каждой из групп.

При группировке, когда резких границ между кластерами не существует, исследователю приходится самому вводить границы между группами объектов.

Литература

  1. Кондаков Н.И. Логический словарь-справочник. – М.: Наука, 1975.
  2. Новиков А.М., Новиков Д.А. Методология научного исследования. – М.: Ленанд, 2010.
  3. Новиков Д.А., Новочадов В.В. Статистические методы в медико-биологическом эксперименте (типовые случаи). – Волгоград: Издательство ВолГМУ, 2005.




[1] Известен такой пример неудачной (нарушающий приведенные требования) классификации, как «Классификация животных китайскими придворными мудрецами»: «Животные подразделяются на: а) принадлежащих Императору, б) бальзамированных, в) прирученных, г) молочных поросят, д) сирен, е) сказочных, ж) бродячих собак, з) включенных в настоящую классификацию, и) буйствующих, как в безумии, к) неисчислимых, л) нарисованных очень тонкой кисточкой из верблюжьей шерсти, м) и прочих, н) только что разбивших кувшин, о) издалека кажущихся мухами».