Главная


yilmaz
Kaban
lgf
prof
comall
mla

Расстояние между станками в цеху


Расположение оборудования с точки зрения соблюдения необходимых разрывов и проходов между станками
Расположение оборудования с точки зрения соблюдения необходимых разрывов и проходов между станками

Категория:

Проектирования технологических процессов



Расположение оборудования с точки зрения соблюдения необходимых разрывов и проходов между станками

Одним из основных требовании к расположению оборудования будет соблюдение необходимых минимальных габаритных разрывов и проходов между станками, а также между станками и стенами, колоннами и другими предметами оборудования цеха. Это необходимо для обеспечения безопасности работающего, нормальных условий труда и правильной работы станка, а также для свободного прохода и транспортирования полуфабрикатов по цеху.

Ввиду важности этого вопроса законодательством Союза предусмотрены общие нормы и правила расположения оборудования в цехе. Эти правила изложены в книге Якимчика «Законодательство по технике безопасности и промышленной санитарии» и др.

Следует, однако, отметить, что в обязательных постановлениях даны лишь общие указания, как надо располагать станки. Детальное же и точное формулирование всех правил расположения оборудования было бы весьма затруднительно, так как пришлось бы в общих постановлениях охватить чрезвычайное разнообразие способов и случаев расположения оборудования.

Таким образом указанные правила, являясь основанием для разрешения вопроса о расстановке оборудования, — для проектирования цеха, не всегда могут дать достаточное указание, как следует поступать в различных случаях. Ниже приведен ряд таких указаний по расположению станков при проектировании с точки зрения соблюдения необходимых разрывов (полученных из практики):

1. Станки должны быть так расположены, чтобы разрывы (расстояния) между ними (а также между станками и частями зданий) были или исключающими возможность прохода между ними , или же, наоборот, не меньше минимального расстояния, обеспечивающего свободный проход.

2. При расположении станков и другого оборудования на плане необходимо для установления надлежащих разрывов показывать на плане (в масштабе) не только станки, но и расположение рабочего во время работы, расположение тележек или ящиков для обрабатываемых деталей (если они размером более 500X500 мм) и транспортеров. Полезно показывать также и расположение вала трансмиссии и шкивов контрприводов. Только при этом условии можно быть уверенным в соблюдении правильных разрывов.

3. Указанные ниже цифры разрывов следует рассматривать как минимально допустимые размеры, меньше которых идти не следует, так как это увеличивает опасность в отношении несчастных случаев, затрудняет работу станков и вызывает ряд неудобств в производстве, а также весьма затрудняет и осложняет междуоперационный транспорт. При увеличении же разрывов надо помнить, что чрезмерное их увеличение влечет за собою излишки в площадях цеха производственных зданий, а стало быть, вызывает излишние капитальные вложения и удорожание производства.

При составлении плана расположения оборудования цеха обычно пользуются масштабом 1 : 50 или 1 : 100, причем станки показываются на плане своими габаритами в соответствующем масштабе. Положение рабочего показывается кружками диаметром 600 мм в принятом масштабе. Валы трансмиссий следует показывать условным пунктиром; также условно обозначаются шкивы трансмиссий и контрприводы. Под габаритом станков принимается контур, очерченный по крайним, выдающимся частям станка, причем для движущихся частей и стола включается в габарит и наибольший размах их как в одну, так и в другую сторону. В габариты автоматов и револьверных станков, предназначенных для прутковой работы, необходимо также включать и величину выступающего у станка прутка. Для протяжных станков в габарит надо включать также протяжный дорн в положении перед началом протяжки. Габариты станков простого очертания обычно представляются в виде очерченного прямоугольника, но в некоторых случаях следует давать и другие формы габаритов, например, для фрезерных, шлифовальных и других станков, в которых форма прямоугольника была бы мало приемлема, так как она не характеризовала бы габарита этих видов станков. Так, фрезерный станок имеет сравнительно узкое основание и длинный стол, который перемещается в ту или другую сторону на значительную величину. Если очертить станок, в данном случае—в виде прямоугольника, получился бы слишком большой габарит. При пользовании подобными габаритами в планировке площадь цеха не была бы достаточно хорошо использована.

На рис. 1 приведен пример габарита фрезерного станка в виде контура, очерчивающего станок, со всеми выступающими частями и движущимся столом. На этой же фигуре слева показан габарит в его обычном виде, лак это делается при планировке цеха.

Рис. 1. Габарит горизонтально-фрезерного станка,

Рис. 2.

Ниже приведены минимальные размеры разрывов при различных случаях расположений станков.

1. Расстояние от стены или перегородки до задней стороны станка должно, как правило, составлять не меньше 600 мм. При станках мелких размеров и при условии, что сзади станка не имеется движущихся частей и при разрыве между станками по фронту не меньше 600 мм, можно устанавливать станки и вплотную к стене, т. е. на расстоянии около 200 мм от стены.

Расстояние между колонной и задней или боковой стороной станка, на которой нет движущихся частей, должно быть не менее 300 лш. Там, где есть движущиеся части, расстояние должно быть не меньше 400 мм при условии отсутствия необходимости рабочему проходить между станками и колоннами во время работы.

2. Расстояния между станками, Между сторонами станков, где есть движущиеся части, расстояние берется не менее 500— 600 мм.

3. Расстояние между станками меньше 500 мм во избежание прохода рабочего следует заграждать цепочками или перилами. Эти промежутки полезно использовать для установки шкафчиков для инструментов или рабочих столиков. В этом случае заграждения не требуются.

4. Установка верстаков может производиться вплотную к колоннам, стенам или перегородкам. Расстояние между тисками должно быть не меньше 1500 мм при массовом производстве; в случае мелких работ это расстояние может быть снижено до 1000 мм.

5. Общая длина линии станков без проходов, как правило, не должна превышать 25—30 м.

6. При расположении станков так, что между стеной или перегородкой и передней стороной станка или фронтом станка находится рабочий, расстояние между стеной и станком должно составлять не меньше 1000 мм.

При наличии у стены отопительных и других устройств на высоте не свыше 2 м от уровня пола указанное расстояние надо считать от наиболее выступающих частей на стене.

7. Расстояние между задней и передней стороной станков при наличии одного рабочего между ними и при отсутствии общего прохода, движения тележки и т. д., — должно составлять не меньше 1000 мм.

Рис. 3.

Рис. 4.

8. Расстояние между фронтами станков, т. е. при наличии двух рабочих между ними, но без движения тележек и общего прохода, должно быть не менее 1502 мм. При крупных станках это расстояние увеличивается до 2000 мм. При обслуживании же одним рабочим двух станков расстояние между фронтами этих станков принимается около 1000 мм, если между этими станками нет общего прохода.

Рис. 5.

9. Минимальный размер проходов для движения тележек определяется следующим образом:
а) при движении тележек в одном направлении величина проходов между рядами станков, обращенными фронтами к проходу, т. е. при наличии двух рабочих в проходе, составляется из ширины габарита нагруженной тележки, плюс по 700 мм на каждое рабочее место, — т. е. 2000 мм и выше;
б) при наличии одного рабочего места величина прохода равна 700 мм на рабочее место плюс 400 мм на промежуток от задней стороны другого станка до габарита тележки и плюс ширина габарита нагруженной тележки, т. е. 1700 мм и выше;
в) расстояние между рядами станков, обращенных к проходу задними или боковыми стенками, берется равным ширине габарита нагруженной тележки плюс 400 мм с каждой стороны тележки, от линии станков до габарита тележки, т. е. 1500 мм и выше;
г) при встречном движении тележек (в ту и другую стороны) сохраняются те же составные данные для общей ширины прохода и, кроме того, прибавляется общая ширина габарита второй тележки и 300 мм на зазор между тележками для их разъезда;
д) для прохода, без движения тележек, следует прибавить к рабочему месту еще 700 мм (для свободного прохода). Таким образом в этом случае, при одном рабочем в проходе, ширина его будет не меньше 1400 мм и при двух рабочих в проходе — не меньше 2100 мм;
е) при наличии в проходах вместо тележек других видов транспорта, например, рольгангов, гладких столов, конвейеров и пр., величина проходов определяется описанным выше способом, т. е. к величине габарита, занимаемого транспортными устройствами, добавляются указанные выше размеры. Проходы между стеной, перегородкой или колонной и линиями станков определяются также изложенным выше способом.

Рис. 6.

Рис. 7.

Рис. 8.

10. Крупные и сложные станки располагаются обычно более свободно, так как это бывает необходимо для их наладки и, в особенности, для всякого рода ремонта на месте. В этих случаях следует давать разрывы кругом станка не менее 500—600 мм. Если же станок требует и обслуживания с различных сторон во время работы, то следует разрывы для таких станков давать не менее 1000 мм.

11. Станки, обрабатывающие крупные детали, в особенности в серийном производстве, должны располагаться также более свободно, учитывая необходимые площади для необработанных и обработанных деталей в пределах намеченных размеров партий или серий этих деталей.

12. Станки, обслуживаемые одним рабочим, расположенные в линию, необходимо ставить возможно ближе друг к другу, вплоть до самых минимальных разрывов, для облегчения их обслуживания. Это ведет к уменьшению вспомогательного времени обработки и увеличению производительности.

13. В массовом производстве, в целях наиболее надежной поточности и наилучшей увязки рабочего места с транспортированием деталей следует, как правило, в направлении потока давать также минимальные разрывы, поскольку увеличение разрывов не требуется какими-либо особыми производственными условиями или особенностями станка.

14. Для большинства станков следует признать более целесообразным, с точки зрения использования площади цеха, ставить станки задними сторонами друг к другу. Это позволяет свести к минимуму промежутки между ними и увеличить проходы.

Приведем несколько примеров расположения оборудования с точки зрения соблюдения необходимых разрывов. На рис. 286 показан пример продольного расположения токарных станков в многоэтажном здании для серийного производства.

Помимо станков, на упомянутых фигурах показано расположение и рабочих во время работы, а также расположение инструментальных шкафчиков и габариты проходов, в зависимости от габарита тележки.

Рис. 9.

Продольное расположение для многоэтажных зданий является обычным, в особенности при трансмиссионном или групповом приводе станков, так как в этом случае трансмиссионное валы удобнее располагать вдоль здания. При индивидуальных моторах можно применять то или иное расположение, но надо отметить, что и в этих случаях для многоэтажных зданий продольное расположение является, обычно, более удобным.

Рис. 10

В одноэтажных зданиях, с верхним светом, продольное и поперечное расположение станков обычно не различается, так как здесь безразлично вдоль какой оси здания располагать станки. Предпочтительнее, однако (с точки зрения использования площади цеха) при различной ширине пролета располагать станки вдоль более широких пролетов.

Более сложным представляется вопрос расположения прутковых автоматов, а также и прутковых револьверных станков. Расположение этих станков в значительной мере зависит от конструкции, размеров станка, длины обрабатываемых прутков, количества установленных в цеху автоматов, а также и количества станков, обслуживаемых одним рабочим. Помимо этого, при расположении станков приходится особенно считаться с конфигурацией здания и отводимой площадью под эти станки. Расположение прутковых автоматов и револьверных станков затрудняется в особенности из-за необходимости оставления достаточного места для зарядки этих станков, которая производится с фронта или с тыла станка: пруток обычно помещается или в целую газовую трубу, поддерживаемую специальными подставками, или вставляется в две небольших трубы, из которых одна находится у станка, а другая на стойке, в конце прутка. Иногда пруток помещается в раскрывающийся на две половины желоб, деревянный или из листового железа. Это позволяет легко вкладывать пруток непосредственно с фронта станка.

По большей части автоматы располагаются таким образом, что зарядка производится с тыла станка, причем прутки вращаются в газовых трубах. Объясняется это тем, что не всякая конструкция автомата допускает удобно зарядку с фронта. В особенности это относится к автоматам больших размеров. При зарядке с фронта труба ставится несколько наискось от оси автомата и пруток заводится в трубу спереди. При такой зарядке требуется меньше дополнительной площади для выдвинутого из трубы прутка, чем это необходимо для зарядки с тыла. При зарядке автомата с тыла необходимо к занимаемой во время работы длине прутка прибавить размер выдвинутого прутка из поддерживающей трубы с таким расчетом, чтобы не загораживать прохода (или же давать специальный проход для зарядки автоматов).

Существует два основных способа расположения автоматов: 1) наклонное расположение и 2) попарное расположение.

Попарное расположение автоматов, несмотря на ряд преимуществ перед наклонным, значительно реже встречается в практике и, главным образом, из-за того, что обслуживание в этом случае группы станков одним рабочим более затруднительно, чем при наклонном расположении. Оба эти способа обладают своими достоинствами и недостатками. Следует отметить, что наклонное расположение автоматов является несколько более компактным, чем попарное расположение, хотя разница между тем и другим способом по занимаемой площади в общем довольно незначительна.

Рис. 11.

Фирмы, изготовляющие мелкие автоматы, иногда рекомендуют производить расположение своих автоматов в порядке попарного расположения, основываясь на нижеследующих доводах: такое расположение не дает никакого изменения в направлении поперечных проходов и дает некоторое удобство при зарядке станков. При наклонном же расположении и при наличии большой группы автоматов рабочему для зарядки приходится проходить всю линию станков, если станки заряжаются с тыла.

Далее, при наклонном расположении контрпривод должен быть поставлен точно над шкивом станка, тогда как для попарного расположения это не имеет существенного значения. При попарном расположении труба, в которой находится пруток, может быть свободно выдвинута влево от рабочего места, благодаря чему получается более удобная зарядка с фронта, чем при наклонном расположении станков. Зарядка с фронта при наклонном расположении для некоторых автоматов, в силу особенности их конструкции (если главный шкив расположен со стороны прутка), иногда бывает весьма неудобна или даже совеем невозможна. К преимуществам наклонного расположения следует отнести то обстоятельство, что станки расположены фронтами в одну сторону и на небольшом расстоянии друг от друга благодаря чему значительно облегчаются условия наблюдения и обслуживания всей линии станков. Иногда при обоих способах расположения автоматы расставляются таким образом, что проходы получаются по диагоналям, как показано на рис. 294—295. Такое расположение автоматов обычно занимает несколько большее место, но зато представляет больше удобства в смысле их обслуживания и зарядки.

Рис. 12.

При расположении станков необходимо учитывать, какая длина обрабатываемого прутка будет поступать в цех. Обычно на рынке имеются прутки длиною 5—6 м, но не всегда на автоматы пускают прутки этой длины. Обычно их разрезают на две половины, благодаря чему проходы между станками сильно уменьшаются и облегчается зарядка станков, в особенности для прутков больших диаметров. При прутках особенно больших размеров (свыше 60 мм) обычно заправка автоматов ведется прутками еще меньшей длины. Расстояние между прутками и соседними станками получается часто весьма незначительное: пруток почти вплотную подходит к корыту или к щиту автомата. Но в работе этот пруток совсем не мешает, так как рабочему весьма редко приходится заходить на противоположную сторону станка, собирание уже обработанных деталей или удаление стружки производится с передней стороны станка. Однако при четырехшпиндельных и шестишпиндельных автоматах это расстояние следует увеличивать до 300 — 400 мм. Автоматы, обслуживаемые с обеих сторон должны иметь расстояние от задней стороны до прутка соседнего автомата не менее 700 мм.

При наклонном расположении автоматы ставятся обычно под углом от 10 до 20° и редко больше. Выбор этого угла зависит от конструкции станка, длины прутков и местных условий расположения станков в цеху. При наклонном расположении автоматов следует их ставить небольшими группами при зарядке станков с тыла, так, чтобы рабочему приходилось проходить не больше 10—16 м для зарядки.

На рис. 13 дан пример наклонного расположения автоматов в многоэтажном здании для зарядки с фронта и с. тыла. Расстояние между автоматами при наклонном расположении зависит от того, откуда производится его зарядка. При зарядке с фронта следует давать разрыв между ними от 600 до 700 мм в зависимости от размеров станка и прутка. При зарадяке с тыла можно уменьшить этот размер до 400—600 мм. При больших размерах автоматов и прутков, следует эти размеры увеличивать, причем не рекомендуется применять способы зарядки с фронта. В особенности это относится к многошпиндельным автоматам.

В отношении револьверных станков нужно сказать то же самое, хотя при небольших размерах и простых конструкциях револьверных станков можно несколько и уменьшить указанные выше размеры.

Рис. 13.

Рис. 14.

Для этих станков чаще применяют способы наклонного расиоложения и зарядки с фронта, так как это дает лучшее использование площади.

На рис. 15 показано наклонное расположение автоматов с оставлением между ними проходов (продольных). В таких случаях расстояния между автоматами (между параллельными их сторонами) делаются от 600 до 800 мм в зависимости от размеров автоматов. Такой способ является обычным для многошпиндельных, а также крупных автоматов.

Рис. 15.


Реклама:

Читать далее:
Расположение оборудования с точки зрения соблюдения правильных производственных потоков

Статьи по теме:

Как измерить расстояния в машинном обучении | Euge Inzaugarat

Все зависит от точки зрения

«Если вы выкопаете яму здесь, в Германии, вы окажетесь в Китае» - Я так сильно рассмеялся, когда мои европейские друзья сказали мне это.

Не потому, что я думал, что это абсурд или что-то в этом роде. Но потому что это высказывание было также очень распространено в Аргентине. Я не думал, что это мировая поговорка.

«Правда? это также распространено там? ” - Они были так же удивлены, как и я.

«Подождите! Есть веб-сайт, на котором вы можете узнать, где вы оказались, если вырыли яму там, где вы стоите », - сказал мой друг. У него всегда был сайт для всего.

«Почему вы думаете, что то же самое здесь и там?» - Другой друг спросил - «Возможно, потому что это указывает на место, которое далеко от того места, где мы родились»

«Для меня Испания очень далеко» - Кто-то еще сказал

От меня, моей родины был далекоТак что для меня 13000 км было далеко. Для некоторых моих друзей 2000 км было очень далеко.

Я начал думать о том, насколько сложным было понятие расстояния, если вы видите его субъективно.

Иногда вы сидите рядом с кем-то, но этот человек кажется таким далеким. В других случаях человек находится в километрах. И сообщение - это все, что нужно, чтобы почувствовать, что кто-то очень близок.

В некоторых случаях, я думаю, что близкое и дальнее зависит от точки зрения.

В машинном обучении многие контролируемые и неконтролируемые алгоритмы используют метрики расстояния для понимания закономерностей во входных данных.Кроме того, он используется для распознавания сходства данных.

Выбор хорошей метрики расстояния улучшит эффективность алгоритмов классификации или кластеризации.

Метрика расстояния использует функции расстояния, которые сообщают нам расстояние между элементами в наборе данных.

К счастью, эти расстояния могут быть измерены с помощью математической формулы. Если расстояние небольшое, элементы, вероятно, похожи. Если расстояние большое, степень сходства будет низкой.

Существует несколько метрик расстояния, которые можно использовать. Важно знать, что они принимают во внимание. Это поможет нам выбрать, какая модель больше подходит для модели, чтобы избежать ошибок или неправильных толкований.

1 Евклидово расстояние: Когда мы говорили о расстояниях ранее, мы в основном думали о расстояниях по более или менее прямой линии.

Если мы думаем о расстояниях между двумя городами, мы думаем о том, сколько километров нам нужно проехать по шоссе.

Эти примеры расстояний, которые мы можем придумать, являются примерами евклидова расстояния . По сути, он измеряет длину сегмента, который соединяет две точки. Давайте посмотрим на это на графике:

Евклидово расстояние

Это звенит какой-нибудь колокол? Вы помните теорему Пифагора из математических классов?

Теорема утверждает, что квадрат гипотенузы (сторона, противоположная прямому углу) равна сумме квадратов двух других сторон .

Ну, Евклидово расстояние можно рассчитать с его помощью.

В нашем примере мы имеем расстояние между двумерными точками, поэтому формула:

Для n-точек общая формула выглядит следующим образом:

Где x и y - два вектора.

Евклидово расстояние - это наиболее часто используемое расстояние для алгоритмов машинного обучения. Это очень полезно, когда наши данные непрерывны. Он также называется L2-Norm .

Итак, евклидово расстояние не достаточно? Зачем нам нужен другой тип расстояний?

В некоторых ситуациях евклидово расстояние не сможет дать нам правильную метрику.В этих случаях нам нужно будет использовать различные функции расстояния.

2 Манхэттенское расстояние: Допустим, мы снова хотим вычислить расстояние между двумя точками. Но на этот раз мы хотим сделать это в виде сетки, как фиолетовая линия на рисунке.

В этом случае соответствующий показатель - Манхэттенское расстояние. Определяется как сумма абсолютных разностей их декартовых координат.

Давайте проясним это. Точка данных имеет набор числовых декартовых координат, которые однозначно определяют эту точку.

Эти координаты представляют собой расстояние от точки до двух фиксированных перпендикулярно ориентированных линий, таких как та, что показана на рисунке ниже. Это также может принести некоторые воспоминания на уроках математики, верно?

декартова система координат

Итак, в нашем примере манхэттенское расстояние будет вычислено следующим образом: Получите разницу в (Δx = x2-x1) и разницу в оси y (Δy = y2-y1). Затем получите их абсолютное число, | Δx | и, наконец, суммируйте оба значения.

В общем случае формула имеет вид:

Метрика Манхэттенского расстояния также называется расстоянием L1 или нормой L1.Если вы знакомы с регуляризацией машинного обучения, вы, наверное, слышали это раньше.

Рекомендуется использовать его при работе с данными большого размера. Кроме того, если вы вычисляете ошибки, это полезно, когда вы хотите сделать акцент на выбросах из-за его линейного характера.

3 Расстояние Минковского: Прежде всего, мы определим некоторые математические термины, чтобы определить расстояние Минковского впоследствии.

  • векторное пространство представляет собой набор объектов, называемых векторами, которые можно складывать и умножать на числа (также называемые скалярами ).
  • Норма - это функция, которая присваивает строго положительную длину каждому вектору в векторном пространстве (единственное исключение - нулевой вектор, длина которого равна нулю). Обычно он представлен как ∥x∥.
  • Нормированное векторное пространство - это векторное пространство над действительными или комплексными числами, для которых определена норма.

Какое это имеет отношение к расстоянию Минковского?

Расстояние Минковского определяется как метрика подобия между двумя точками в нормированном векторном пространстве (N-мерное реальное пространство).

Он также представляет обобщенную метрику, которая включает евклидово и манхэттенское расстояние.

Как выглядит формула?

Если мы обратим внимание, когда λ = 1, мы получим расстояние до Манхэттена. Если λ = 2, мы находимся при наличии евклидова расстояния. Существует еще одно расстояние, называемое расстоянием Чебышева , которое происходит, когда λ = ∞.

В целом, мы можем изменить значение λ, чтобы рассчитать расстояние между двумя точками разными способами.

Когда мы его используем? Расстояние Минковского часто используется, когда интересующие переменные измеряются по шкалам отношений с абсолютным нулевым значением.

4 Расстояние Махаланобиса: Когда нам нужно вычислить расстояние двух точек в многомерном пространстве, нам нужно использовать расстояние Махаланобиса.

Мы говорили ранее о декартовой системе координат. Мы нарисовали перпендикулярные линии. Затем мы рассчитали расстояния в соответствии с этой системой координат.

Это очень легко сделать, если наши переменные не коррелированы. Потому что расстояния можно измерить прямой линией.

Допустим, присутствуют две или более коррелированные переменные.Также добавим, что мы работаем с более чем 3 измерениями. Теперь проблема усложняется.

В этих случаях расстояние Махаланобисов спасает нас. Он измеряет расстояние относительно центроида для многомерных данных. В этом пункте средства от всех переменных пересекаются.

Его формула следующая:

, где Xa и Xb - пара объектов, а C - выборочная ковариационная матрица.

5 Схожесть косинусов: Давайте представим, что вам нужно определить, насколько похожи два документа или совокупность текста.Какие метрики расстояния вы будете использовать?

Ответ косинус сходство .

Чтобы рассчитать его, нам нужно измерить косинус угла между двумя векторами. Затем косинусное сходство возвращает нормированное скалярное произведение их.

Нормализованный вектор - это вектор в том же направлении, но с нормой 1.

Точечное произведение - это операция, в которой два вектора одинаковой длины умножаются, в результате чего получается один скаляр.

Косинусное сходство

Итак, формула для косинусного сходства:

, где A и B - векторы, ∥ A∥ и ∥ B∥ - норма A и B, а cosθ - косинус угла между A и B ,Это также можно записать другими словами:

Сходство косинусов очень полезно, когда нас интересует ориентация, но не величина векторов.

Два вектора с одинаковой ориентацией имеют косинусное сходство 1. Два вектора под углом 90 ° имеют сходство 0. Два диаметрально противоположных вектора имеют сходство -1. Все не зависит от их величины.

6 Jaccard расстояние: Наконец, мы изменим наше внимание. Вместо того, чтобы вычислять расстояния между векторами, мы будем работать с множествами.

Набор - это неупорядоченная коллекция объектов. Так, например, {1, 2, 3, 4} равно {2, 4, 3, 1}. Мы можем вычислить его мощность (представленную как | set |), которая является ничем иным, как количеством элементов, содержащихся в наборе.

Допустим, у нас есть два набора объектов, A и B. Интересно, сколько у них общих элементов. Это называется Пересечение . Математически он представлен как A ∩ B.

Возможно, мы хотим получить все предметы независимо от того, к какому набору они принадлежат.Это называется Союз . Он представлен математически как A ∪ B.

Мы можем изобразить это лучше, используя диаграммы Венна.

Пересечение и Союз, изображенные голубым на диаграммах Венна.

Как это связано со сходством Жакара? Сходство Жакара определяется как мощность пересечения определенных множеств, деленная на мощность объединения их. Он может быть применен только к конечным наборам выборок.

Жаккарда сходство = | A ∩ B | / | A ∪ B |

Представьте, что у нас есть множество A = {«цветок», «собака», «кошка», 1, 3} и B = {«цветок», «кошка», «лодка»}.Тогда A ∩ B = 2 и A ∪ B = 6. В результате сходство Жакара равно 2/6 = 3.

Как мы уже говорили, все эти метрики используются в нескольких алгоритмах машинного обучения.

Машинное обучение: измерение сходства и расстояния

Примечание куратора : Если вам понравился пост ниже, не стесняйтесь проверить карточку машинного обучения, автором которой является Рики Хо!

Измерение сходства или расстояния между двумя точками данных является основополагающим для многих алгоритмов машинного обучения, таких как K-Nearest-Neighbor, Clustering ... и т. Д. В зависимости от характера точки данных могут использоваться различные измерения.


Расстояние между числовыми точками данных

Когда измерение точки данных является числовым, общая форма называется расстоянием Минковского , как показано здесь:

( (Икс 1 - у 1 ) р + (х 2 - у 2 ) р ) 1 / р

Когда p = 2, это эквивалентно евклидову расстоянию .Когда p = 1, это эквивалентно Манхэттенскому расстоянию .

Эта мера не зависит от основного распределения данных. Но что, если значение по x-измерению намного больше, чем значение по y-измерению? Мы должны сначала привести их в порядок. Распространенным способом является выполнение z-преобразования , где каждая точка данных сначала вычитает среднее значение, а затем делит стандартное отклонение.

(Икс 1 , у 1 ) становится ((х 1 - μ x ) / σ х , (у 1 - μ и ) / σ и )

Эта мера, хотя и учитывает распределение каждого измерения, предполагает, что измерения не зависят друг от друга.Но что, если x-измерение имеет некоторую корреляцию с y-измерением? Чтобы рассмотреть корреляции между различными измерениями, мы используем это:

расстояние Махаланобис = (v 1 -v 2 ) T .CovMatrix. (v 1 -v 2 ) где v 1 = ( х 1 , у 1 )

Если мы заботимся о направлении данных, а не о их величине, то использование косинусного расстояния является обычным подходом.Он вычисляет скалярное произведение двух точек данных, деленное на произведение их величины. Расстояние косинуса, вместе с термином / матрицей документа, обычно используется для измерения сходства между документами.


Расстояние между категориальными точками данных

Поскольку у нас нет упорядочения между категориальными значениями, мы можем только измерить, являются ли категориальные значения одинаковыми или нет. В основном мы измеряем степень, в которой значения атрибутов перекрываются. Расстояние Хэмминга можно использовать для измерения количества атрибутов, которые должны быть изменены, чтобы соответствовать друг другу. Мы можем рассчитать соотношение, чтобы определить сходство (или разницу) между двумя точками данных, используя простой коэффициент совпадения :

noOfMatchAttributes / noOfAttributes

Однако в некоторых случаях равенство определенных значений ничего не значит. Например, скажем, точка данных представляет пользователя с атрибутами, представляющими каждый фильм.Точка данных содержит двоичное значение высокой размерности, указывающее, что пользователь видел или не видел фильм ( 1 представляют «да», а 0 представляют «нет»). Учитывая, что большинство пользователей видят только небольшую часть всех фильмов, если оба пользователя не видели определенный фильм (значение 0 для обоих), это не указывает на сходство между пользователями. С другой стороны, если оба пользователя видели один и тот же фильм (значение 1 для каждого), подразумевается, что пользователи имеют много общего. В этом случае равенство 1 должно иметь гораздо больший вес, чем равенство 0.Это приводит к подобию Жакарты , как видно здесь:

noOfOnesInBoth / (noOfOnesInA + noOfOnesInB - noOfOnesInAandB)

Независимо от того, совпадают значения или нет, однако, если категория структурирована как древовидная иерархия, то расстояние между двумя категориями можно количественно определить по длине пути их общего родителя. Например, «/ product / spot / ballgame / баскетбол» ближе к «/ product / spot / ballgame / soccer / shoes», чем «/ product / luxury / handbags», потому что общий родитель имеет более длинный путь.


Расстояние между смешанными категориальными и числовыми точками данных

Когда точка данных содержит смесь числовых и категориальных атрибутов, мы можем рассчитать расстояние каждой группы и затем обработать каждый показатель расстояния как отдельное измерение (числовое значение).

расстояние финал = α.distance числовой + (1-) расстояние категорический


Расстояние между последовательностями (String, TimeSeries)

В случае, если каждый атрибут представляет элемент последовательности, нам нужен другой способ измерения расстояния.Например, предположим, что каждая точка данных представляет собой строку (которая содержит последовательность символов) - тогда расстояние редактирования - это обычный инструмент измерения. В основном, расстояние редактирования показывает, сколько «модификаций» (которые можно вставить, изменить, удалить) необходимо для преобразования строки A в строку B. Обычно это рассчитывается с использованием техники динамического программирования.

Временной ряд является еще одним примером данных последовательности. Аналогично концепции расстояния редактирования, Dynamic Time Warp искажает измерение времени, добавляя больше точек данных в оба временных ряда, минимизируя квадратную ошибку между соответствующими парами.Мы узнаем, где добавить эти точки данных, используя похожую технику динамического программирования. Вот очень хорошая статья, которая описывает детали.


Расстояние между узлами в сети

В однородном неориентированном графе (узлы одного типа) расстояние между узлами может быть измерено по кратчайшему пути.

В двухстороннем графе есть два типа узлов, в которых каждый узел соединяется только с другим типом. (Например, люди, присоединяющиеся к сообществам.) Сходство узлов можно измерить, проанализировав, насколько похожи их связанные сообщества, если узлы одного типа.

SimRank - это итерационный алгоритм, который вычисляет сходство узлов. Это достигается путем сложения сходств между всеми парами узлов разных типов. Другие типы сходства узлов вычисляются таким же образом.

Мы также можем использовать вероятностный подход, такой как RandomWalk , чтобы определить сходство.Каждый «узел людей» будет передавать токен (метку с именем людей) вдоль случайно выбранного, связанного «узла сообщества» (взвешенного по степени связности). Каждый узел сообщества будет распространять полученный токен обратно на случайно выбранный узел людей. Теперь люди, получившие распространенный токен, могут сбросить токен (с возможностью бета-тестирования) или снова распространить его среди случайно выбранного сообщества. Этот процесс продолжается до тех пор, пока все жетоны не исчезнут (поскольку они могут быть отброшены). После этого мы получаем Матрицу трассировки и вычисляем сходство, основываясь на точечном произведении токенов, которые оно получает.


Расстояние между населением

Вместо того, чтобы измерять расстояние между отдельными точками данных, мы также можем сравнить набор точек данных (например, совокупности) и измерить расстояние между ними. Фактически, одна важная часть статистики состоит в том, чтобы измерить расстояние между двумя группами выборок, чтобы увидеть, является ли «разница» достаточно значительной, чтобы сделать вывод, что они из разных групп населения.

Скажем, в составе населения есть члены, принадлежащие к разным категориям, и мы хотим измерить, имеют ли население A и население B одинаковые или разные пропорции членов в таких категориях.Мы можем использовать Chi-Square или KL-Divergence для измерения расстояния их разделения.

В случае, если у каждого члена населения есть два различных числовых атрибута (например, вес и рост), и мы хотим вывести один атрибут из другого, учитывая, что они коррелируют, коэффициент корреляции количественно определяет их степень корреляции. И не имеет значения, движутся ли эти два атрибута в одном и том же направлении (более тяжелые люди выше), в другом направлении (более тяжелые люди ниже) или независимо друг от друга.Коэффициент корреляции варьируется от -1 (отрицательно коррелированный) до 0 (без корреляции) до 1 (положительно коррелированный).

Если два атрибута являются категориальными (а не числовыми), то взаимной информации является распространенным способом измерения их зависимостей. Это определяет, поможет ли знание значения одного атрибута определить значение другого.

Предположим, что два судьи оценивают коллекцию предметов, и нас интересует, насколько их порядки ранжирования совпадают.Мы можем использовать коэффициент ранга Спирмена , чтобы измерить степень их консенсуса в порядке ранжирования.

,

Gensim: расстояние Word Movers '

Демонстрирует использование ОМУ Генсимом.

Word Mover's Distance (WMD) - это многообещающий новый инструмент в машинном обучении, который позволяет нам отправить запрос и вернуть наиболее актуальные документы. это Учебное пособие представляет ОМУ и показывает, как вы можете рассчитать расстояние ОМУ между двумя документами, используя wmdistance .

Основы ОМУ

ОМУ позволяет нам оценить «расстояние» между двумя документами в значимой Кстати, даже когда у них нет общих слов.Он использует word2vec [4] векторных вложений слова. Было показано, что он превосходит многие современные методы в к - классификация ближайших соседей [3].

ОМУ показано ниже для двух очень похожих предложений (иллюстрация сделана из блога Влада Никулае). Предложения не имеют общих слов, но, сопоставляя соответствующие слова, ОМУ может точно измерить (не) сходство между двумя предложениями. Метод также использует представление документов в сумке слов (проще говоря, частоты слова в документах), отмеченные как $ d $ на рисунке ниже. Интуиция позади метода заключается в том, что мы находим минимальное «расстояние путешествия» другими словами, наиболее эффективный способ «переместить» распространение документа 1 к распространению документа 2.

 # Изображение с https://vene.ro/images/wmd-obama.png импортировать matplotlib.pyplot как plt импортировать matplotlib.image как mpimg img = mpimg.imread ('wmd-obama.png') imgplot = plt.imshow (img) plt.axis ( 'выключено') plt.show () 

Out:

 / тома / работа / рабочее пространство / gensim_misha / docs / src / gallery / tutorials / run_wmd.py: 42: UserWarning: Matplotlib в настоящее время использует agg, который не является GUI, поэтому не может показать рисунок. plt.show () 

Этот метод был представлен в статье «От вложения Word в документ» Расстояния »от Matt Kusner et al. (ссылка на PDF). Это вдохновило «Движением Земли», и использует решатель «транспорта проблема».

В этом уроке мы узнаем, как использовать функциональность ОМУ Gensim, которая состоит из метода wmdistance для вычисления расстояния и WmdSimility класс для корпусных запросов на основе сходства.

Важно

Если вы используете функциональность ОМУ Gensim, рассмотрите возможность цитирования [1], [2] и [3].

Вычисление расстояния до слова

Чтобы использовать ОМУ, вам нужны некоторые существующие вложения слов. Вы можете обучить свою собственную модель Word2Vec, но это выходит за рамки этого руководства (Проверьте модель Word2Vec, если вы заинтересованы). Для этого урока мы будем использовать существующую модель Word2Vec.

Давайте возьмем несколько предложений, чтобы вычислить расстояние между ними.

 # Инициализировать ведение журнала. ведение журнала импорта logging.basicConfig (format = '% (asctime) s:% (имя уровня) s:% (message) s', level = logging.INFO) remace_obama = 'Обама говорит со СМИ в Иллинойсе' remace_president = 'Президент приветствует прессу в Чикаго' 

Эти предложения имеют очень похожее содержание, и поэтому ОМУ должно быть низким. Прежде чем вычислять ОМУ, мы хотим удалить стоп-слова («the», «to» и т. Д.), поскольку они не вносят большой вклад в информацию в предложениях.

 # Импорт и загрузка стоп-слов из NLTK. из nltk.corpus импорт стоп-слов из nltk импорт скачать download ('stopwords') # Скачать список стоп-слов. stop_words = stopwords.words ('english') def preprocess (предложение): вернуть [w для w в предложении.lower (). split (), если w не в stop_words] предложение_обама = препроцесс (предложение_обама) предложение_президент = препроцесс (предложение_президент) 

Out:

 [nltk_data] Загрузка стоп-слов пакета в [nltk_data] / Users / kofola3 / nltk_data... [nltk_data] Стоп-слова пакета уже актуальны! 

Теперь, как упоминалось ранее, мы будем использовать некоторые загруженные предварительно обученные вложения. Мы загружаем их в класс модели Gensim Word2Vec.

Важно

Вложения, которые мы здесь выбрали, требуют много памяти.

 импорт gensim.downloader как API model = api.load ('word2vec-google-news-300') 

Итак, давайте вычислим ОМУ, используя метод wmdistance .

 расстояние = модель.wmdistance (суждение_обама, предложение_президент) печать ('расстояние =% .4f'% расстояние) 

Out:

Давайте попробуем то же самое с двумя совершенно не связанными предложениями. Обратите внимание, что расстояние больше.

 remace_orange = preprocess («Апельсины - мой любимый фрукт») расстояние = model.wmdistance 
.

Смотрите также



© 2015, All-Stanki.ru - оборудование для производства окон пвх и стеклопакетов Содержание, карта сайта.