Процессор, графика | Процессор Intel® Core™ i7-1185G7 (12-28 Вт), графика Intel® Iris® Xe Процессор Intel® Core™ i5-1145G7 (12-28 Вт), графика Intel® Iris® Xe Процессор Intel® Core™ i7-1180G7 (7-15 Вт), графика Intel® Iris® Xe Процессор Intel® Core™ i7-1140G7 (7-15 Вт), графика Intel® Iris® Xe | Процессор Intel® Xeon® W-11955M, UHD-графика Intel® Процессор Intel® Xeon® W-11855M, UHD-графика Intel® Процессор Intel® Core™ i9-11950H, UHD-графика Intel® Процессор Intel® Core™ i7-11850H, UHD-графика Intel® Процессор Intel® Core™ i5-11550H, UHD-графика Intel® | Процессор Intel® Core™ i9-10900K, UHD-графика Intel® 630 Процессор Intel® Core™ i9-10900, UHD-графика Intel® 630 Процессор Intel® Core™ i9-10900T, UHD-графика Intel® 630 Процессор Intel® Core™ i7-10700K, UHD-графика Intel® 630 Процессор Intel® Core™ i7-10700, UHD-графика Intel® 630 Процессор Intel® Core™ i7-10700T, UHD-графика Intel® 630 Процессор Intel® Core™ i5-10600K, HD-графика Intel® 630 Процессор Intel® Core™ i5-10600, HD-графика Intel® 630 Процессор Intel® Core™ i5-10600T, HD-графика Intel® 630 Процессор Intel® Core™ i5-10505, HD-графика Intel® 630 Процессор Intel® Core™ i5-10500, HD-графика Intel® 630 Процессор Intel® Core™ i5-10500T, HD-графика Intel® 630 Процессор Intel® Core™ i9-11900K, UHD-графика Intel® 750 Процессор Intel® Core™ i9-11900, UHD-графика Intel® 750 Процессор Intel® Core™ i9-11900T, UHD-графика Intel® 750 Процессор Intel® Core™ i7-11700K, UHD-графика Intel® 750 Процессор Intel® Core™ i7-11700, UHD-графика Intel® 750 Процессор Intel® Core™ i7-11700T, UHD-графика Intel® 750 Процессор Intel® Core™ i5-11600K, UHD-графика Intel® 750 Процессор Intel® Core™ i5-11600, UHD-графика Intel® 750 Процессор Intel® Core™ i5-11600T, UHD-графика Intel® 750 Процессор Intel® Core™ i5-11500, UHD-графика Intel® 750 Процессор Intel® Core™ i5-11500T, UHD-графика Intel® 750 | Набор микросхем | Встраивается в корпус процессора | Набор микросхем Intel® WM590 (требуется для процессора Intel® Xeon® W-11955M / W-11855M) Набор микросхем Intel® QM580 | Набор микросхем Intel® Q570 | Локальная сеть | Адаптер Intel® Ethernet Connection I219-LM Intel® Ethernet Controller I225-LM (2. 5GbE) | Адаптер Intel® Ethernet Connection I219-LM Intel® Ethernet Controller I225-LM (2.5GbE) | Адаптер Intel® Ethernet Connection I219-LM Intel® Ethernet Controller I225-LM (2.5GbE) | Беспроводные сети | Intel® Wi-Fi 6E AX210 Intel® Wi-Fi 6 AX201 Intel® Wi-Fi 6 AX200 | Intel® Wi-Fi 6E AX210 Intel® Wi-Fi 6 AX201 Intel® Wi-Fi 6 AX200 | Intel® Wi-Fi 6E AX210 Intel® Wi-Fi 6 AX201 | Thunderbolt™ | Встроенная технология Thunderbolt™ 4 | Контроллер Intel® JHL8540 Thunderbolt™ 4 (опция) | Вариант памяти Intel® Optane™ M10 | Память Intel® Optane™ серии h30 с твердотельным накопителем Память Intel® Optane™ серии h20 с твердотельным накопителем | Память Intel® Optane™ серии h30 с твердотельным накопителем | Память Intel® Optane™ серии h30 с твердотельным накопителем |
CRM
CRM – ваш инструмент для построения управляемого цифрового бизнеса.
Нужна ли вам CRM-система?
Да, если хотя бы на половину вопросов из приведенных ниже вы ответите утвердительно:
- Знаете ли вы стоимость привлечения каждого клиента, инициации сделки?
- Есть ли сложности с сегментацией клиентов?
- Достаточно ли регламентирован процесс работы? Хотели бы вы его улучшить?
- Можно ли оперативно отслеживать качество клиентского сервиса?
- Есть ли у вас возможность быстро собирать данные по воронке продаж по отделам, сотрудникам и т.п.?
Оставить заявку
Партнерство с Softline – это выгодно! Три главные причины
Пакет сервисов под ключ. В рамках проекта мы не только внедрим систему CRM, но и поставим лицензии, сопутствующий софт, железо и облачные ресурсы, обеспечим безопасность, в т.ч. касательно защиты персональных данных, осуществим интеграцию с внешними системами и поддержку.
Облачные сервисы. Глобальные или на территории РФ, в полном соответствии с 152-ФЗ.
Модернизация существующей CRM-системы. Специалисты Softline устранят платформенные ошибки старой версии, сделают полное или частичное обновление, осуществят любые другие проектные доработки – например, могут сделать интерфейс системы более понятным и простым для пользователей.
ТОП-5 сервисов Softline по внедрению CRM
Аудит бизнес-процессов. У вас уже есть CRM-система, но она не работает, как надо? Хотите подобрать систему, но не знаете, какую выбрать? Мы поможем!
Формирование концепции. Разработка архитектуры системы, проект внедрения.
Пилотное внедрение. Отличная возможность, чтобы оценить функционал системы, реализовав небольшой блок задач.
Комплексный проект по внедрению системы. От поставки железа или облака до технической поддержки.
Техническая поддержка. Обеспечим постоянную работоспособность всех систем.
Выгоды в ключевых областях
Маркетинг
Задача: Проанализировать результат маркетинговых активностей и увеличить конверсию лидов в продажи.
Решение: CRM – удобный инструмент планирования, проведения и оценки эффективности мультиканальных маркетинговых кампаний. CRM помогает обратиться к нужной аудитории в нужное время, обработать маркетинговые показатели и результаты и повысить продажи. Стоимость привлечения клиента с помощью CRM снижается, а конверсия увеличивается.
Продажи
Задача: Выстроить четкий и управляемый процесс продаж.
Решение: С помощью CRM сотрудникам будет намного проще выстраивать взаимоотношения с текущими и потенциальными клиентами, регистрировать в системе сделки, заказы, счета, договоры. Работа отделов продаж становится эффективнее, снижается отток клиентов. Также CRM делает планирование более достоверным. При необходимости в системе можно держать продуктовый каталог с ценами.
Сервис
Задача: Сделать обработку обращений дешевле и качественнее.
Решение: CRM – это оптимальный инструмент для любой сервисной структуры, позволяющий управлять обращениями, сокращая время на их обработку. В системе можно разместить базу знаний для операторов или для самообслуживания клиентов. Также возможно управление SLA и контрактами на обслуживание.
Выберите свою CRM-систему с Softline!
Microsoft Dynamics CRM подойдет компаниям, которые:
|
Terrasoft выбирают организации, которые:
|
Это трансформация к лучшему!
C успешным внедрением CRM-системы в организациях происходит переосмысление огромного количества бизнес-процессов; руководители приходят к новому пониманию важных показателей и трансформируют подход к продажам, маркетингу и услугам, открывая новые перспективы для себя и своей компании.
По всем вопросам вы можете проконсультироваться с нашими экспертами:
Курсы по выбору (3 модуль) для студентов 3 и 4 курсов
Студент выбирает 1 весенний курс по выбору из следующего списка:Курсы по выбору для студентов 3 курса
Анализ данных в бизнесеВведение в объектно-ориентированное программирование
Вероятностные модели и статистика случайных процессов
Машинное обучение 2
Теория игр
Математическая логика и сложность вычислений
Курсы по выбору для студентов 4 курса
Анализ данных в бизнесеОбучение с подкреплением
Функциональное программирование
Конфликты и кооперации
1.
Анализ данных в бизнесеЛектор: Филипенков Николай Владимирович, к.ф.-м.н., компания SAS
Интеллектуальный анализ данных находит всё большее применение в различных отраслях экономики. Совершенствуются математические методы, разрабатываются новые модели и подходы для решения прикладных бизнес задач. При этом практическое применение методов интеллектуального анализа данных в бизнесе требует специализированных знаний и навыков. Целью данного курса является рассмотрение современных подходов, инструментов и методов интеллектуального анализа данных, применяемых в таких прикладных областях как клиентская аналитика, управление рисками и управление бизнес-процессами. Обучение построено на изучении не только соответствующих математических моделей и алгоритмов, но и на рассмотрении примеров их реального применения в этих областях, что позволит студентам изучить весь жизненный цикл аналитической модели, начиная с этапа формирования требований и подготовки данных и заканчивая этапом внедрения и эксплуатации.
2. Введение в объектно-ориентированное программирование
Лектор: Ивченко Олег Николаевич, МФТИДанный курс посвящен изучению объектно-ориентированного подхода в программировании на примере языка Java. Слушатели курса познакомятся с такими свойствами программного кода как объект, класс-интерфейс, класс-наследник, инкапсуляция, полиморфизм. Детально будут разобраны принципы выбора интерфейса при разработке программы: принцип SOLID, принцип подстановки Лискова. В заключении курса будут изучены широко известные паттерны проектирования,причины их возникновения, решаемые ими задачи, а также критерии применимости.
Презентация курса
3. Вероятностные модели и статистика случайных процессов
Курс дает теоретический и практический фундамент, необходимый при решении множества реальных промышленных задач, связанных с анализом данных в режиме реального времени. Необходимость в таких методах возникает во многих прикладных областях — например, при анализе временных рядов цен на акции, спроса на товары, числа посещений главной страницы интернет-поисковика. Трудность таких задач заключается в требовании максимально эффективного использования накопленной и поступающей информации для прогнозирования появления событий в неизвестном будущем или их обнаружения при неопределенном настоящем. Курс дает двоякие знания — математическую базу теории случайных процессов и навыки практической реализации алгоритмов анализа данных в оффлайн и онлайн-режимах. Будут рассмотрены основные подходы и вероятностные модели теории случайных процессов, такие как гауссовость, марковость, авторегрессионные модели, локально стационарные модели, модели в задачах скорейшего обнаружения; численные алгоритмы, в том числе сегментация, шумоподавление, оценка статистических характеристик, ключевые статистики в задачах обнаружения разладок и аномалий; слушателям будет предложена серия задач, направленных на анализ реальных данных посредством практического применения рассматриваемых подходов.
Проект программы курса
4. Машинное обучение 2
! Студенты специализации «Машинное обучение и приложение» не выбирают этот курс, т. к. он включен в пул обязательных курсов специализации на 3м году обучения.
Данный курс посвящён изучению продвинутых методов и постановок задач анализа данных, а также теоретических основ алгоритмов машинного обучения. В программу курса входят нейронные сети, матричные разложения, рекомендательные системы, основы анализа текстов, методы активного и онлайн-обучения, обучение с подкреплением, основы теоретических оценок обобщающей способности. Семинарские занятия посвящены освоению практических особенностей изучаемых методов, знакомству с современными инструментами анализа данных и разбору подходов к решению прикладных задач.
Программа дисциплины
5. Теория игр (преподается на английском языке)
Game theory is a mathematical language of modern economic and social science.Any time a model involves conflict of interest game theory is needed since itis the study of strategic decision making. Game theory has numerousapplications including economic theory, political science, evolutionarybiology, computer science, etc.
This is an introductory course, covering the foundations of game theory as wellas giving insights into some of its present-day applications. The coursepresents main ideas and techniques of game-theoretic analysis. The aim is to teach students to use game theoretic approach, to think strategically. Success with this course gives edge both in deeper understanding of human behavior andin tackling business problems.
6. Математическая логика и сложность вычислений
Теория вычислений и логика в их современном виде появились одновременно (и даже в работах одних и тех же людей — Гёделя, Чёрча, Тьюринга и других), и это не случайно: процесс формального вывода (применение разрешённых правил) и процесс вычисления (детерминированное применение разрешённых правил) по природе близки. Знаменитая теорема Гёделя (не все истинные утверждения формально доказуемы) означает на языке теории вычислений, что множество истинных утверждений неперечислимо — и в такой форме легко следует из классических результатов теории вычислений. Впоследствии появились и другие связи: логические теории можно использовать для доказательства свойств программ, классы сложности можно описывать в логических терминах, поэтому знакомство с основными понятиями и результатами логики входит в базовое образование программистов. Кое-что уже было в курсе дискретной математики — и в этом курсе мы пойдём дальше (и, в частности, докажем теорему Гёделя о неполноте).
Проект программы дисциплины
7. Обучение с подкреплением
Лектор: Панин АлександрЕсли приглядеться к нашей жизни, можно заметить, что мы обычно занимаемся отнюдь не разметкой примеров и отображением из пространства объектов в пространство ответов, минимизирующим эмпирический риск; мы существуем в мире, на который мы можем влиять, и который в свою очередь влияет на нас. А хотим мы в этом мире добиваться каких-то результатов: дойти до “из точки A точки B”, заработать побольше денег, привлечь и удержать пользователя — кому что ближе. Задачи эти объединяет то, что в них приходится двигаться методом проб и ошибок — у нас просто нет всеобъемлющей выборки, в которой есть правильная стратегия поведения во всех ситуациях. А ещё эти задачи объединяет то, что их можно решать автоматически.
Курс даёт слушателям понимание и практические навыки использования методовобучения с подкреплением. В программу входят теоретическая база, практические задания, инженерные трюки и неординарные предметные области.
Проект программы дисциплины8. Функциональное программирование
! Студенты специализации «Распределенные системы» не выбирают этот курс, т.к. он включен в пул обязательных курсов специализации на 4м году обучения.
Слушатели курса познакомятся с функциональными языками программирования на примере языка программирования Haskell, изучат отличия функционального подхода к программированию от традиционного императивного, познакомятся с лямбда-исчислением как теоретической основой функционального программирования, познакомятся с системами типов функциональных языков и алгоритмом вывода типов Хиндли-Дамаса-Милнера.
Проект программы курса
9. Конфликты и кооперации (преподается на английском языке)
This course presents an introduction to cooperative games, solutions and applications to conflict situations.
Draft Syllabus↑ вернуться
Вопросы и ответы Amazon WorkSpaces
Вопрос. Соответствует ли Amazon WorkSpaces требованиям HIPAA?
Ответ. Да. Если вы заключили с AWS договор делового партнерства (BAA), можно использовать Amazon WorkSpaces с аккаунтами AWS, связанными с данным BAA. Если вы не заключили договор BAA с AWS, напишите нам, и с вами свяжется представитель службы продаж AWS. Подробнее см. на странице Соответствие требованиям HIPAA.
Вопрос. Соответствует ли Amazon WorkSpaces стандарту PCI?
Ответ. Да. Amazon WorkSpaces соответствует требованиям PCI и стандарту безопасности данных индустрии платежных карт (PCI DSS). PCI DSS – это стандарт безопасности конфиденциальной информации, администрируемый Советом по стандартам безопасности индустрии платежных карт, который был основан компаниями American Express, Discover Financial Services, JCB International, MasterCard Worldwide и Visa Inc. Стандарт PCI DSS распространяется на все юридические лица, которые занимаются хранением, обработкой или передачей данных владельцев карт и (или) конфиденциальных данных аутентификации, в том числе на торговые компании, процессинговые центры, эквайеров, эмитентов карт и поставщиков услуг. Стандарт PCI DSS утверждается платежными системами, а его администрированием занимается Совет по стандартам безопасности данных индустрии платежных карт. Подробнее см. в разделе Соответствие требованиям PCI DSS.
Вопрос. Какие данные нужны для входа в Amazon WorkSpaces?
Ответ. Пользователи входят в свой рабочий стол WorkSpaces, используя уникальные данные для доступа, которые они могут создать после предоставления им рабочего стола WorkSpaces. Если вы интегрировали сервис Amazon WorkSpaces с существующим доменом Active Directory, то пользователи будут выполнять вход, используя свои данные для доступа к Active Directory. Помимо этого, для многофакторной аутентификации (MFA) предусмотрена интеграция Amazon WorkSpaces с существующими серверами RADIUS.
Вопрос. Можно ли управлять тем, какие клиентские устройства имеют доступ к рабочим столам Amazon WorkSpaces?
Ответ. Да. Ограничить доступ к рабочим столам Amazon WorkSpaces можно на основе типа ОС клиентов, а также с помощью цифровых сертификатов. Можно блокировать или разрешить доступ для MacOS, Microsoft Windows, Linux, iPadOS, Android, Chrome OS, нулевого клиента и клиента WorkSpaces Web Access.
Вопрос. Что такое цифровой сертификат?
Ответ. Цифровой сертификат – это цифровое удостоверение, которое действительно в течение определенного периода времени и может использоваться как данные для входа, предоставляющие идентификационную информацию, а также другие сопутствующие сведения. Цифровой сертификат выдается центром сертификации (CA), при этом CA гарантирует достоверность информации, содержащейся в сертификате.
Вопрос. Какие устройства используют цифровые сертификаты для управления доступом к рабочим столам Amazon WorkSpaces?
Ответ. Цифровые сертификаты могут быть использованы для блокировки или разрешения доступа к рабочим столам WorkSpaces для клиентских устройств, работающих под управлением MacOS и Microsoft Windows.
Вопрос. Как использовать цифровые сертификаты для управления доступом к рабочим столам Amazon WorkSpaces?
Ответ. Чтобы использовать цифровые сертификаты для блокировки или разрешения доступа к рабочим столам Amazon WorkSpaces, требуется загрузить корневые сертификаты в консоль управления WorkSpaces и распространить клиентские сертификаты на устройства под управлением MacOS, Windows, Android и на совместимые с Android устройства с ОС Chrome, которые вы хотите сделать доверенными. Чтобы распространить клиентские сертификаты, используйте любое удобное решение, например Microsoft System Center Configuration Manager (SCCM) или программное обеспечение для управления мобильными устройствами (MDM). Дополнительную информацию см. в разделе Restrict WorkSpaces Access to Trusted Devices.
Вопрос. Сколько корневых сертификатов может быть импортировано в каталог Amazon WorkSpaces?
Ответ. Для каждого каталога Amazon WorkSpaces можно импортировать до двух корневых сертификатов, по одному для устройств с MacOS и устройств с Microsoft Windows. Если импортировано два корневых сертификата, рабочие столы WorkSpaces будут предоставлять оба корневых сертификата клиентскому устройству и клиентское устройство будет использовать первый сертификат, соответствующий любому из корневых сертификатов.
Вопрос. Можно ли управлять доступом клиентского устройства к Amazon WorkSpaces без использования цифровых сертификатов?
Ответ. Да. Доступом к Amazon WorkSpaces можно управлять, используя только тип устройства.
Вопрос. Можно ли использовать цифровые сертификаты для управления доступом к Amazon WorkSpaces для устройств с iPadOS или для нулевых клиентов?
Ответ. В настоящее время рабочие столы Amazon WorkSpaces могут использовать цифровые сертификаты только с клиентскими устройствами, работающими под управлением macOS, Microsoft Windows и Andriod, или совместимыми с Android устройствами с ОС Chrome.
Вопрос. Что такое Multi-Factor Authentication (MFA)?
Ответ. Многофакторная аутентификация добавляет еще один уровень безопасности в процесс аутентификации пользователей. Пользователи должны пройти идентификацию, предоставив некую известную им информацию (например, пароль), а также подтвердив доступ к некому объекту (например, предоставив одноразовый пароль (OTP) аппаратного или программного происхождения).
Вопрос. Какие методы доставки поддерживаются при использовании MFA?
Ответ. Amazon поддерживает одноразовые пароли, которые доставляются с помощью аппаратных и программных токенов. Использование внешних токенов (например, СМС-токенов) в настоящее время не поддерживается.
Вопрос. Поддерживается ли аутентификация Google или другие виртуальные решения многофакторной аутентификации?
Ответ. Аутентификация Google может использоваться совместно с RADIUS. Если у вас имеется сервер RADIUS, работающий на платформе Linux, то вы можете настроить ваши группы RADIUS для использования аутентификации Google через библиотеку PAM (подключаемых модулей аутентификации).
Вопрос. Какие клиентские приложения Amazon WorkSpaces поддерживают Multi-Factor Authentication (MFA)?
Ответ. Многофакторная аутентификация (MFA) доступна в клиентских приложениях Amazon WorkSpaces на следующих платформах: Windows, Mac, Linux, Chromebook, iOS, Fire, Android и нулевых клиентах PCoIP. Многофакторная аутентификация (MFA) также доступна при веб-подключении к Amazon WorkSpaces.
Вопрос. Что произойдет, если пользователь забудет пароль доступа к своему рабочему столу Amazon WorkSpaces?
Ответ. Если для интеграции с существующим доменом Active Directory используется AD Connector или AWS Microsoft AD, пользователю необходимо будет выполнить процедуру восстановления пароля, которая принята в действующем домене, например обратиться во внутреннюю службу поддержки. Если пользователь использует данные для доступа, хранящиеся в каталоге сервиса WorkSpaces, он может сбросить пароль, нажав ссылку «Forgot Password» в клиентском приложении Amazon WorkSpaces.
Вопрос. Как обеспечивается защита рабочих столов Amazon WorkSpaces от вредоносных программ и вирусов?
Ответ. На рабочие столы WorkSpaces можно установить любое антивирусное ПО по выбору. Пакет Plus уже включает доступ к антивирусному ПО; подробные сведения по данному предложению можно найти здесь. Если вы хотите установить собственное антивирусное ПО, убедитесь, что оно не блокирует UDP-порт 4172 для PCoIP и UDP-порт 4195 для WSP, так как это помешает пользователям подключаться к своим рабочим столам WorkSpaces.
Вопрос. Как отключить доступ пользователя к рабочему столу Amazon WorkSpaces?
Ответ. Чтобы отключить доступ пользователя к рабочему столу WorkSpaces, можно отключить его аккаунт в каталоге, управляемом сервисом WorkSpaces, или в существующем каталоге Active Directory, интегрированном с сервисом WorkSpaces.
Вопрос. Работают ли рабочие столы WorkSpaces с AWS Identity and Access Management (IAM)?
Ответ. Да. Подробнее см. в документации.
Вопрос. Могу ли я выбрать организационное подразделение (ОП), в котором в моем каталоге Active Directory будут создаваться аккаунты компьютеров?
Ответ. Да. Вы можете задать организационное подразделение (ОП), в котором в каталоге Active Directory будут создаваться аккаунты компьютеров для рабочих столов WorkSpace. Такое ОП может быть частью домена, к которому принадлежат ваши пользователи, или частью домена, который имеет доверительные отношения с доменом ваших пользователей, или частью дочернего домена в вашем каталоге. Подробнее см. в документации.
Вопрос. Могу ли я использовать группы безопасности Amazon VPC для ограничения доступа из моих рабочих столов WorkSpace к ресурсам (приложениям, базам данным) в моей сети или в Интернете?
Ответ. Да. Вы можете использовать группы безопасности Amazon VPC для ограничения доступа из ваших рабочих столов WorkSpace к ресурсам в сети или в Интернете. Вы можете выбрать группу безопасности Amazon VPC по умолчанию для сетевых интерфейсов WorkSpaces в вашем VPC в качестве части сведений о каталоге в консоли WorkSpaces. Подробнее см. в документации.
Вопрос. Что такое группы IP Access Control?
Ответ. Группы IP Access Control – это возможность указывать доверенные IP-адреса, которым разрешен доступ к рабочим столам WorkSpaces. Группа управления доступом состоит из набора правил, каждое из которых определяет разрешенный IP-адрес или диапазон адресов. Используя эту возможность, можно создать до 25 групп IP Access Control и до 10 правил для каждой группы, определяя IP-адреса или диапазоны IP-адресов, доступные для рабочих столов Amazon WorkSpaces.
Вопрос. Можно ли использовать IP Access Control для рабочих столов WorkSpaces?
Ответ. Да. Используя эту возможность, можно создать до 25 групп IP Access Control и до 10 правил для каждой группы, определяя IP-адреса или диапазоны IP-адресов, доступные для рабочих столов Amazon WorkSpaces.
Вопрос. Как реализовать средства контроля доступа на основе IP-адресов?
Ответ. Подробнее см. в разделе Группы IP Access Control.
Вопрос. Функцию IP Access Control можно использовать для всех клиентов WorkSpaces?
Ответ. Да. Эта функция может использоваться с macOS, iPad, рабочими столами Windows, планшетами Android и с доступом через веб-интерфейс. IP Access Control также поддерживает нулевых клиентов, использующих многофакторную аутентификацию.
Вопрос. Какие конфигурации нулевого клиента совместимы с возможностью IP Access Control?
Ответ. IP Access Control может использоваться для нулевых клиентов, использующих многофакторную аутентификацию, а также для любых совместимых нулевых клиентов, которые не используют PCoIP Connection Manager для подключения к рабочим столам WorkSpaces. Никакие подключения через PCoIP Connection Manager не смогут получить доступ к рабочим столам WorkSpaces, если включена возможность IP Access Control.
Вопрос. Существуют ли сценарии, при которых IP-адрес, не входящий в белый список, может получить доступ к рабочему столу WorkSpaces?
Ответ. Да. При доступе к WorkSpaces с через веб-клиент (если таковой доступен), если IP-адрес, входящий в белый список, меняется на IP-адрес, не входящий в белый список, уже после того, как данные для доступа пользователя будут проверены, но до начала сеанса рабочего стола WorkSpaces доступ с IP-адреса, не входящего в белый список, будет разрешен. Для первоначального подключения требуется IP-адрес, входящий в белый список.
Вопрос. Как IP-адреса включаются в белый список, если пользователи получают доступ к рабочим столам WorkSpaces через систему трансляции сетевых адресов (NAT)?
Ответ. Для использования контроля доступа на основе IP-адресов необходимо предоставить разрешения публичным IP-адресам, поэтому если используется NAT, нужно разрешить доступ со всех IP-адресов, исходящих от NAT. В этом случае каждый раз, когда пользователь обращается к рабочим столам WorkSpaces через NAT, доступ будет разрешен.
Вопрос. Каким образом включить IP-адреса в белый список для доступа из сетей VPN?
Ответ. Если требуется разрешить доступ из сетей VPN, нужно будет добавить в белый список публичные IP-адреса VPN. В этом случае каждый раз, когда пользователь обращается к рабочим столам WorkSpaces через VPN с публичными IP-адресами, включенными в белый список, доступ будет разрешен.
Вопрос. Можно ли изменить процедуру входа в систему для удобства конечных пользователей?
Ответ. WorkSpaces поддерживает URI (унифицированный идентификатор ресурса) WorkSpaces://, при использовании которого открывается клиент WorkSpaces и вводится на выбор код регистрации, имя пользователя и/или код многофакторной аутентификации (MFA) (если ваша организация использует MFA).
Вопрос. Как активировать URI?
Ответ. Уникальные ссылки URI можно создать с помощью возможностей форматирования URI WorkSpaces, описанных в разделе Customize How Users Log in to their WorkSpaces руководства администратора Amazon WorkSpaces. Получив эти ссылки, пользователи могут использовать URI на любом устройстве с установленным клиентом WorkSpaces. Ссылки URI могут содержать удобочитаемую конфиденциальную информацию, если в них включен код регистрации, имя пользователя и/или код MFA, поэтому следует внимательно относиться к тому, как и кому передается информация URI.
ETC / USD сталкивается с еще одной подозреваемой 51% -ной атакой на его сеть
Цена Ethereum Classic не упала ниже 7,00 $, но если есть сообщения о 51% атаке, Ethereum может быть бычьим
Цена Ethereum Classic по отношению к доллару США осталась выше 7,10 доллара, несмотря на потенциально катастрофическую атаку на его блокчейн.
Быки ETC / USD успешно избежали шортов, но если давление продаж усилится и его недавний нисходящий тренд продолжится в течение следующих нескольких торговых дней, все еще может быть трудно поддерживать поддержку в ключевой области $ 7. 00.
На момент написания статьи сообщество Ethereum Classic осознало, что еще один разрушительный отчет о том, что блокчейн подвергся второй атаке на 51% за неделю.
6 августа сложность майнинга в версии Ethereum Classic за несколько часов увеличилась более чем на 52%, и первый из них провел обмен, чтобы подтвердить, что в сети произошла еще одна 51% атака.
Binance — одна из первых платформ, которая публикует твиты, заявляя, что в Ethereum Classic Edition была проведена новая реорганизация блокчейнов, включающая более 4000 блоков. В предыдущей атаке на прошлой неделе злоумышленник использовал хорошо скоординированную атаку с двойным расходом, чтобы украсть нативные токены на сумму более 5 миллионов долларов. Подобно этой ситуации, злоумышленник манипулировал более чем 4200 блоков.
Сооснователь Ethereum Виталик Бутерин отметил, что классическая версия Ethereum может лучше перейти на модель доказательства кола. Сам Ethereum готовится перейти на PoS с помощью обновления ETH 2. 0, которое запланировано на конец лета.
ETH / USD техническая точка зрения
После восстановления после падения на 6,60 долл. США 2 августа Ethereum Classic колебался в диапазоне ниже 7,50 долл. В течение последних пяти дней. Согласно данным CoinMarketCap, цена криптовалюты упала на 1,57% за последнюю неделю.
Хотя уменьшение объема покупок указывает на большой медвежий рынок, технические перспективы предполагают, что боковая торговля более вероятна в краткосрочной перспективе.
Медвежий ETC / USD потерял поддержку на уровне 7,298 долл. Для 50-SMA и 7,123 долл. Для 20-SMA. Однако, учитывая небольшой рост RSI, быки все еще имеют право голоса. Несмотря на негативное влияние рисков безопасности, MACD также сформировал положительную дивергенцию на 4-часовых временных рамках.
ETC / USD цена 4-часовой график на TradingView
В настоящее время «быкам» необходимо предотвратить прорыв в размере 7 долларов — эту критическую область необходимо защитить, чтобы предотвратить дальнейшее снижение.
Сильный толчок от текущего уровня может привести к тому, что быки вновь увидят основное сопротивление около 7,50 долл., А затем продолжат рост до 8,00 долл. На этой основе. Если цена не сможет остаться выше 7,00 долларов, резкое снижение может заставить быков рассчитывать на поддержку 100-SM A.
Источник информации: составлено из COINJOURNAL по информации 0x. Авторские права принадлежат автору Бенсон Тоти, и не могут быть воспроизведены без разрешения
От временных рядов к сложным сетям: график видимости
Аннотация
В этой работе мы представляем простой и быстрый вычислительный метод, алгоритм видимости , который преобразует временной ряд в график. Построенный граф наследует в своей структуре несколько свойств ряда. Таким образом, периодические ряды преобразуются в регулярные графы, а случайные ряды — в случайные графы. Более того, фрактальные ряды превращаются в безмасштабные сети, усиливая тот факт, что степенные распределения степеней связаны с фрактальностью, что недавно широко обсуждалось. Приведены некоторые замечательные примеры и аналитические инструменты для проверки надежности метода. Многие различные меры, недавно разработанные в теории сложных сетей, могут с помощью этого нового подхода охарактеризовать временные ряды с новой точки зрения.
В этой статье мы представляем инструмент для анализа временных рядов: график видимости . Этот алгоритм отображает временной ряд в сеть. Основная идея состоит в том, чтобы изучить, в какой степени методы и фокус теории графов полезны как способ характеристики временных рядов.Как будет показано ниже, эта сеть наследует некоторые свойства временного ряда, и ее изучение позволяет выявить нетривиальную информацию о самом ряду.
Для наглядности на рис. 1 представлена схема алгоритма видимости. В верхней зоне мы наносим первые 20 значений периодического ряда с помощью вертикальных полос (значения данных отображаются над графиком). Рассматривая это как ландшафт, свяжем каждый бар (каждую точку временного ряда) со всеми теми, которые видны сверху рассматриваемого (серые линии), получив ассоциированный график (показан в нижней части рисунка ). На этом графике каждый узел соответствует рядовым данным в том же порядке, и два узла связаны, если существует видимость между соответствующими данными, то есть если существует прямая линия, соединяющая рядовые данные, при условии, что это «линия видимости» не пересекает никакую промежуточную высоту данных.
Рис. 1.Пример временного ряда (20 значений данных) и связанного с ним графика, полученного с помощью алгоритма видимости. На графике каждый узел соответствует в том же порядке ряду данных.Лучи видимости между данными определяют связи, соединяющие узлы в графе.
Более формально, мы можем установить следующие критерии видимости: два произвольных значения данных ( T A , a A ) и ( T B , y b ) будут иметь видимость и, следовательно, станут двумя связанными узлами связанного графа, если любые другие данные ( t c , y c Мы можем легко проверить, что с помощью настоящего алгоритма ассоциированный граф, извлеченный из временного ряда, всегда имеет вид:
Подключен: каждый узел видит как минимум своих ближайших соседей (слева и справа).
Ненаправленный: алгоритм построен таким образом, что в ссылках не определено направление.
Инвариантен при аффинных преобразованиях данных рядов: критерий видимости инвариантен при масштабировании как горизонтальной, так и вертикальной осей, а также при горизонтальном и вертикальном переносе (см. рис. 2).
В недавней работе (1) Чжан и Смолл (ZS) представили еще одно сопоставление между временными рядами и сложными сетями. Хотя философия аналогична этой работе (кодирование временных рядов на графике для характеристики ряда с использованием теории графов), между обоими методами существуют фундаментальные различия, в основном в том, что относится к диапазону применимости (ZS фокусируется только на псевдопериодическом времени). серии, связывая каждый цикл серии с узлом и определяя связи между узлами с помощью мер временной корреляции, тогда как граф видимости может применяться к любому типу временных рядов) и связности графа (в ZS гигантская компонента обеспечивается только ad hoc; между тем , граф видимости всегда связен по определению).
Рис. 2.График видимости временного ряда остается неизменным при нескольких преобразованиях временного ряда. ( a ) Исходный временной ряд со ссылками на видимость. ( b ) Перевод данных. ( c ) Вертикальное масштабирование. ( d ) Масштабирование по горизонтали. ( e ) Добавление линейного тренда к данным. Как видно на нижней диаграмме, во всех этих случаях граф видимости остается неизменным.
Ключевой вопрос состоит в том, чтобы узнать, наследует ли ассоциированный граф некоторую структуру временного ряда и, следовательно, можно ли охарактеризовать процесс, породивший временной ряд, с помощью теории графов.На первом этапе рассмотрим периодические ряды. На самом деле пример, изображенный на рис. 1, представляет собой не что иное, как периодический ряд с периодом 4. Соответствующий граф видимости является регулярным, если он построен путем периодического повторения шаблона. Распределение степеней этого графика формируется конечным числом пиков, связанных с периодом ряда, во многом в духе спектра мощности Фурье временного ряда. Вообще говоря, все периодические временные ряды отображаются в виде регулярных графиков, причем дискретное распределение степеней является отпечатком периодов временных рядов.Таким образом, в случае периодических временных рядов его регулярность, по-видимому, сохраняется или структурно наследуется в графе посредством карты видимости.
В отличие от периодических рядов, на втором этапе мы рассмотрим ряд R ( t ) из 10 6 значений данных, извлеченных из равномерного распределения в [0, 1]. Хотя в первый момент можно было бы ожидать распределения степени Пуассона в этом случае [как для некоррелированных случайных графов (2)], случайный временной ряд действительно имеет некоторую корреляцию, потому что это упорядоченное множество.Фактически, пусть k t будет связностью узла, связанного с данными t . Если k t велико (в связи с тем, что данные имеют большое значение и, следовательно, они имеют большую видимость), можно было бы ожидать, что k t +1 будет относительно небольшим , потому что временной ряд является случайным и маловероятно появление двух последовательных значений данных с большим значением. Именно из-за этих «маловероятно» больших значений (хабов) хвост распределения степеней отклоняется от распределения Пуассона.Два больших значения в данных ряда можно понимать как два редких события в случайном процессе. Распределение этих событий во времени действительно является экспоненциальным (3), поэтому мы должны ожидать, что хвост распределения степеней в этом случае будет экспоненциальным, а не пуассоновским, поскольку форма этого хвоста связана с распределением хаба.
В левой части рис. 3 изображены первые 250 значений R ( t ). В правой части мы строим распределение степеней P ( k ) его графика видимости.Хвост этого распределения, как и ожидалось, довольно хорошо соответствует экспоненциальному распределению. Обратите внимание, что на этом этапе также рассматривались временные ряды, извлеченные случайным образом из распределений, отличных от равномерного. В каждом случае алгоритм фиксирует случайный характер ряда, а конкретная форма распределения степеней графа видимости связана с конкретным случайным процессом.
Рис. 3.Случайный ряд. ( Left ) Первые 250 значений R ( t ), где R — случайный ряд из 10 6 значений данных, извлеченных из U[0,1].( Right ) Распределение градусов P ( k ) графика видимости, связанного с R ( t ) (построено в полулогарифмическом масштабе). Хотя начало кривой приближается к результату пуассоновского процесса, хвост явно экспоненциальный. Такое поведение связано с данными с большими значениями (редкими событиями), которые являются концентраторами.
До сих пор упорядоченные (периодические) ряды преобразовывались в регулярные графы, а случайные ряды преобразовывались в экспоненциальные случайные графы; структура порядка и беспорядка во временном ряду, по-видимому, унаследована от топологии графа видимости.Таким образом, возникает вопрос: Какой вид графа видимости получается из фрактального временного ряда? Этот вопрос сам по себе интересен в настоящее время. В последнее время интенсивно обсуждается связь между самоподобными и безмасштабными сетями (4⇓⇓⇓–8) (9⇓⇓–12). Хотя сложные сети (5) обычно обладают свойством маленького мира (13) и, следовательно, не могут быть размерно-инвариантными, недавно было показано (9), что, применяя методы покрытия подогнанными ящиками и процедуры перенормировки, некоторые реальные сети на самом деле проявляют самостоятельную работу. -сходство.Таким образом, хотя самоподобие, кажется, подразумевает свободу от масштаба, обратное в общем случае неверно.
Для более подробного изучения этих вопросов рассмотрим следующие два фрактальных ряда: хорошо известное броуновское движение B ( t ) и ряд Конвея (14). В то время как броуновское движение представляет собой хорошо известный случай самоаффинности [действительно, имеет место следующее соотношение: ], ряд Конвея a ( n ) − n / 2 представляет собой рекурсивно сгенерированный фрактальный ряд из: На рис. 4 мы изобразили поведение этих рядов, распределение степеней P ( k ) их соответствующих графиков видимости и их среднюю длину пути L ( N ) в зависимости от длины ряда. Во-первых, оба ряда имеют графики видимости с распределениями степеней, которые соответствуют степенным законам формы P ( k ) ∼ k −α , где мы получаем разные показатели степени в каждом случае: этот результат усиливает тот факт, что , в контексте алгоритма видимости степенные распределения степеней [то есть безмасштабные сети (6⇓⇓–9)] естественным образом возникают из фрактальных рядов.Более того, это отношение кажется устойчивым до тех пор, пока предыдущие примеры демонстрируют различные виды фрактальности: в то время как B ( t ) обозначает стохастический самоаффинный фрактал, ряд Конвея представляет собой рекурсивно генерируемый детерминированный ряд. Однако, в то время как броуновский график видимости, кажется, свидетельствует об эффекте маленького мира (рис. 4 вверху справа ) как L ( N ) ∼ log( N ), ряд Конвея, в свою очередь, показывает аналогичное отношение (рис.4 Нижний правый ) формы L ( N ) ∼ N β . Этот факт можно объяснить с точки зрения так называемого явления отталкивания узлов (11): графики видимости, связанные со стохастическими фракталами, такими как броуновское движение или ряды общих шумов, не свидетельствуют об отталкивании между узлами (в этих рядах очевидно, что данные с наибольшими значениями будут обозначать хабы, и эти данные будут иметь видимость друг с другом), и, следовательно, не будут фрактальными сетями согласно Song et al. (11). Однако ряд Конвея на самом деле свидетельствует об отталкивании ступиц: этот ряд имеет вогнутую форму и, следовательно, наибольшие значения данных ни в коем случае не будут относиться к ступицам; последние, скорее всего, располагались бы в монотонных областях серии, которые действительно скрыты друг от друга (эффективное отталкивание) по локальным максимумам серии. Таким образом, график видимости Конвея является фрактальным.
Рис. 4.Фрактальная серия. ( Верхний от слева до справа ) Первые 4000 значений данных из броуновского ряда 10 6 значений данных.( Center ) Степень распределения графика видимости, связанного с броуновским движением. Это степенной закон P ( k ) ∼ k −α с α = 2,00 ± 0,01. ( Right ) График зависимости средней длины пути этой сети от размера сети N . Наилучшее соответствие обеспечивает логарифмическое масштабирование L ( N ) = 1,21 + 0,51 log( N ). Эта сеть демонстрирует эффект маленького мира в дополнение к тому, что она не масштабируется.( Нижний от слева до справа ) Первые 10 5 значений данных из ряда Конвея 4 · 10 6 значений данных. ( Center ) Распределение степеней графа видимости, связанного с рядом Конвея. Это степенной закон P ( k ) ∼ k −α с α = 1,2 ± 0,1. Средняя длина пути как функция размера N изображена в Right . Наилучшее соответствие обеспечивает масштабирование по степенному закону L ( N ) = 0.76 Н 0,38 . Тогда эта сеть масштабно-инвариантна.
Поскольку фрактальный ряд характеризуется своим показателем Херста, мы можем утверждать, что граф видимости действительно может различать различные типы фрактальности, что будет подробно изучено в дальнейшей работе. Обратите внимание, что некоторые другие фрактальные серии также были изучены [серия Q (15), серия Штерна (16) и серия Туэ-Морса (17) и т. д.] с аналогичными результатами. Кроме того, обратите внимание, что если исследуемый ряд увеличивает свою длину, то полученный граф видимости может быть интерпретирован в терминах модели роста сети и может в конечном итоге пролить свет на проблему формирования фрактальной сети.
Чтобы пролить свет на взаимосвязь между фрактальными рядами и степенными законами распределения, на рис. 5 Слева мы представляем детерминированный фрактальный ряд, сгенерированный итерацией простого шаблона из трех точек. Серия начинается (шаг 0) с трех точек (A, B и C) с координатами (0, 1), (1, 1/3) и (2, 1/3) соответственно. На шаге p вводим 2 p + 1 новых точек высотой 3 − p −1 и удаленных 3 − p Ряды образуют самоподобное множество: применяя изотропное масштабирование горизонтального масштаба 3 p и вертикального масштаба 3 p к образцу порядка p , мы восстанавливаем исходный образец.
Рис. 5.Простой детерминированный фрактал. ( Left ) Фрактальный ряд, полученный итерацией исходного паттерна (точки A, B и C) с p = 10 шагов. ( Right ) Значения K r (кружки) и K l (квадраты) в зависимости от размера фрактала, связанные с уравнениями 3 и 5 . Обратите внимание, что график логлинейный; таким образом, отношение является экспоненциальным. Прямые линии соответствуют приближениям, полученным в уравнениях. 4 и 6 .
Обратите внимание, что этот временной ряд не является равномерно распределенным, как в предыдущих примерах. Однако его полезность определяется тем, что с ним достаточно просто обращаться аналитически, то есть находить распределение степеней его графа видимости. Основная идея состоит в том, чтобы найти повторяющееся поведение, при котором данный узел увеличивает свою связность при увеличении фрактального шага (то есть размера фрактала) (18).Затем мы вычисляем, сколько узлов (самоподобных ему) появляется на каждом шаге, и из обоих соотношений мы приходим к распределению степеней для этих видов узлов.
Во-первых, из беглого визуального изучения рис. 5 Слева можно сделать вывод, что узлы A и B обычно имеют одинаковую степень. Однако степень узла C можно разложить на два термина: левая степень (из-за видимости узлов слева от C) и правая степень. Степень A и B такая же, как и правильная степень C (статистически говоря, A и B увеличивают свою связность по мере увеличения размера фрактала так же, как и правая часть C).Таким образом, степень C предоставляет всю информацию о системе. Мы будем цитировать k k R ( C , N ) Правильная степень узла C в диаракте N -Step (соответственно, K L ( C , n ) обозначает левую степень).
Применяя критерий видимости, можно геометрически найти, что где μ — функция Мебиуса. Заметим, что это суммирование согласуется с числом неприводимых многочленов степени не выше n над полем Галуа GF(2) (19), что заслуживает более глубокого исследования.Это выражение может быть аппроксимировано выражением Однако есть повторение в левой степени, которое читается ведущий член которого Узел C , таким образом, имеет степень K ( C ) = K R R ( C , N ) + K L ( C , и ). На рис. 5 Right представлены значения K r (кружки) и K l (квадраты) в зависимости от размера фрактала (количество итераций ).Числовые значения нанесены в виде внешних кругов и квадратов, тогда как внутренние круги и квадраты получены из графических уравнений. 3 и 5 . Обратите внимание, что обе формулы воспроизводят числовые данные. Прямые линии соответствуют уравнениям аппроксимации. 4 и 6 . Теперь на общем шаге p , 2 p узлов, самоподобных C, появляются (по построению). Эти узлы будут иметь степень K(C,n−p)=245(n−p)+2n−p, которая для больших значений n − p может быть аппроксимирована до K ( C , n − p ) ≃ 2 n − p .Определяя f ( K ) как распределение степеней, мы получаем, что переменной u ≡ 2 n − p легко получить: то есть распределение степеней, связанное с узлами C, является степенным законом. Хотя этот простой пример не дает общего объяснения того, почему фрактальность преобразуется в степенное распределение, он может служить общим способом работы с детерминированными фрактальными рядами, генерируемыми итерацией.
После представления метода видимости можно сделать несколько замечаний: обратите внимание, что обычно два ряда, отличающиеся только аффинным преобразованием, будут иметь один и тот же граф видимости; в этом смысле алгоритм поглощает аффинное преобразование. Кроме того, легко увидеть, что некоторая информация о временных рядах неизбежно теряется при отображении из-за того, что структура сети полностью определяется в (бинарной) матрице смежности. Например, два периодических ряда с одинаковым периодом T 1 = {…, 3, 1, 3, 1, …} и T 2 = {…, 3, 2, 3, 2, …} будет иметь тот же график видимости, хотя и отличающийся количественно.Хотя суть графа видимости состоит в том, чтобы сосредоточиться на структурных свойствах временных рядов (периодичность, фрактальность и т. д.), метод можно тривиально обобщить с помощью взвешенных сетей (где матрица смежности не является бинарной, а веса определяют наклон кривой). линия видимости между двумя значениями данных), если нам в конечном итоге потребуется количественно различать временные ряды, например, T 1 и T 2 .
Хотя в этой статье мы рассмотрели только неориентированные графы, обратите внимание, что можно также выделить ориентированный граф (связанный с направлением временной оси) таким образом, чтобы для данного узла можно было различать две разные связности: входящая степень k в , связанное с тем, сколько узлов видят данный узел i , и исходящая степень k из , то есть количество узлов, которые видит узел i .В этой ситуации, если граф прямой видимости, извлеченный из данного временного ряда, не является инвариантным относительно обращения времени [то есть, если P ( k in ) ≠ P ( k out )] , можно утверждать, что процесс, породивший ряд, не является консервативным. В первом приближении мы изучили неориентированный вариант, а направленный вариант будет рассмотрен в дальнейшей работе.
Можно предложить несколько прямых применений метода.Связь между показателем распределения степеней и показателем Херста ряда будет рассмотрена в дальнейшей работе. В частности, оказывается, что представленный здесь метод представляет собой надежный инструмент для оценки показателей Херста, поскольку выполняется функциональная связь между показателем Херста фрактального ряда и распределением степеней его графа видимости (JCN, BL, LL, и FB, неопубликованная работа). Обратите внимание, что оценка показателей Херста является очень важным вопросом анализа данных, который еще предстоит полностью решить (см.20). Дробные броуновские движения — понятие, представляющее большой интерес в самых разных областях, от электронных устройств до биологии, — также будут рассмотрены в связи с предыдущим пунктом.
Более того, способность алгоритма обнаруживать не только разницу между случайными и хаотическими рядами, но и пространственное расположение обратных бифуркаций в хаотических динамических системах является еще одним фундаментальным вопросом, который также будет лежать в основе дальнейших исследований (неопубликованная работа). .Наконец, граф видимости характеризует нетривиальные временные ряды, и в этом смысле метод может быть уместным в конкретных задачах, связанных с различной одеждой, таких как недавно предложенные временные ряды поведения человека (21).
Таким образом, представлен алгоритм преобразования временных рядов в графики. Структура временного ряда сохраняется в топологии графа: периодические ряды преобразуются в регулярные графы, случайные ряды — в случайные графы, а фрактальные ряды — в безмасштабные графы. Такая характеристика выходит за рамки предыдущих пунктов, поскольку разные топологии графов возникают из внешне похожих фрактальных серий.Фактически, этот метод улавливает явление отталкивания концентратора, связанное с фрактальными сетями (11), и, таким образом, отличает графы видимости без масштаба, свидетельствующие об эффекте маленького мира, от тех, которые демонстрируют масштабную инвариантность. С помощью алгоритма видимости был построен естественный мост между теорией сложных сетей и анализом временных рядов.
Благодарности
Мы благодарим редактора и двух анонимных рецензентов за их комментарии. Эта работа была поддержана грантом Министерства науки Испании FIS2006-08607.
Сноски
Вклад авторов: Б.Л., Ф.Б. и Дж.С.Н. проектное исследование; Л.Л. и Б.Л. проведенное исследование; Л.Л. и Б.Л. предоставил новые реагенты/аналитические инструменты; Л.Л., Б.Л., Ф.Б. и Дж.Л. проанализировали данные; и Л.Л. написал статью.
Авторы заявляют об отсутствии конфликта интересов.
Эта статья является прямой отправкой PNAS. А.-Л.Б. является приглашенным редактором по приглашению редколлегии.
- Поступила в редакцию 29 сентября 2007 г.
- © 2008 г. Национальной академии наук США
Изучение статистических и демографических аспектов сложности сети
Abstract
Характеристика и определение сложности объектов — важная, но очень трудная задача, вызывающая большой интерес во многих различных областях. В этой статье мы вводим новую меру, называемую показателем сетевого разнообразия (NDS), которая позволяет нам количественно определять структурные свойства сетей.Мы численно демонстрируем, что наша оценка разнообразия способна различать упорядоченные, случайные и сложные сети друг от друга и, следовательно, позволяет нам классифицировать сети в зависимости от их структурной сложности. Мы изучили 16 дополнительных показателей сложности сети и пришли к выводу, что ни один из этих показателей не обладает такими же хорошими возможностями категоризации. В отличие от многих других мер, предложенных до сих пор для характеристики структурной сложности сетей, наша оценка отличается по целому ряду причин.Во-первых, наша оценка мультипликативно состоит из четырех отдельных оценок, каждая из которых оценивает различные структурные свойства сети. Это означает, что наша общая оценка отражает структурное разнообразие сети. Во-вторых, наша оценка определяется для совокупности сетей, а не для отдельных сетей. Мы покажем, что это устраняет нежелательную двусмысленность, присущую показателям, основанным на отдельных сетях. Чтобы применить нашу меру на практике, мы предоставляем статистическую оценку оценки разнообразия, основанную на конечном числе выборок.
Образец цитирования: Эммерт-Страйб Ф., Демер М. (2012) Изучение статистических и демографических аспектов сложности сети. ПЛОС ОДИН 7(5): е34523. https://doi.org/10.1371/journal.pone.0034523
Редактор: Alex J. Cannon, Pacific Climate Impacts Consortium, Canada
Получено: 9 ноября 2011 г.; Принято: 2 марта 2012 г.; Опубликовано: 8 мая 2012 г.
Авторское право: © 2012 Emmert-Streib, Dehmer.Это статья с открытым доступом, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.
Финансирование: Frank Emmert-Streib поддерживается Школой медицины, стоматологии и биомедицинских наук Королевского университета Белфаста. Matthias Dehmer поддерживается Австрийскими научными фондами для поддержки этой работы (проект P22029-N13).Спонсоры не участвовали в разработке исследования, сборе и анализе данных, принятии решения о публикации или подготовке рукописи.
Конкурирующие интересы: Drs. Франк Эммерт-Страйб и Матиас Демер являются членами редакционной коллегии PLoS ONE. Это не меняет приверженности авторов всем политикам PLoS ONE в отношении обмена данными и материалами.
Введение
Сложность — это общее понятие, которое вызвало большое количество исследований в различных областях, от биологии, химии и математики до физики [1]–[9].Несмотря на эту привлекательность, до сих пор отсутствует общепринятое описание сложности объекта, позволяющее установить количественную меру его характеристики. Вероятно, наиболее изученными объектами с точки зрения характеристики их сложности являются одно- и двумерные строки или последовательности символов. Для таких объектов было предложено множество подходов к количественному определению или оценке сложности [3], [8], [10]–[18]. Однако внутренняя проблема любой меры сложности заключается в том, что существуют альтернативные способы восприятия и, следовательно, описания сложности, что неизбежно приводит к множеству различных мер сложности [19].Например, колмогоровская сложность [2], [3], [8], [20] основана на алгоритмической теории информации, рассматривающей объекты как отдельные строки символов, тогда как меры эффективных мер сложности (ЭМС) [16], избыточных энтропия [21], прогностическая информация [22], термодинамическая глубина [17] или статистическая сложность [14] связывают объекты со случайными величинами и, следовательно, являются ансамблевыми или популяционными.
В контексте сетей меры сложности графов были предложены для исследования сложности химических графов, представляющих молекулы и химические соединения [23]–[25]. Были разработаны различные типы мер сложности графа, которые можно в целом разделить на информационно-теоретические и неинформационно-теоретические. Поскольку до сих пор в значительной степени неясно, какие структурные особенности сети следует подчеркивать, были разработаны иерархические подходы к химической сложности, состоящие из нескольких иерархических уровней молекулярной сложности. Одна из первых попыток была предпринята Берцем [26], разработавшим иерархическую модель, содержащую как топологические (т.е., разветвленность, кольца, кратные связи) и нетопологические (размер молекулы, симметрия, функциональность, элементный состав) признаки; подробное обсуждение см. в [25]. Позже Бончев и Полански [27] развили эту систему и описали общую сложность химической системы векторным подходом. Компоненты этого вектора представляют различные характеристики сложности, например размер системы, топологию графа, физическую природу, метрику системы и ее симметрию [27].
Также для сетей общего назначения было предложено множество показателей сложности сети [24], [28]. Многие из них основаны на принципах теории информации [29]–[31]. Классический неинформационно-теоретический подход — это так называемая комбинаторная сложность , введенная Миноли [32]. Эта мера представляет собой монотонно возрастающую функцию факторов, влияющих на сложность сети, например, количества вершин и ребер, степеней вершин, кратных ребер, циклов, петель и меток [33]. Другие методы основаны на определении конкретных подструктур в графах [24], [28].Также Константин и др. [34] определил сложность графа как количество содержащихся в нем остовных деревьев. Операторный подход был разработан Юкной [35], который определил сложность графа как минимальное количество операций объединения и пересечения, необходимых для получения всего множества его ребер, начиная со звездных графов. Подходы к определению сложности графов на основе колмогоровской парадигмы сложности [3] можно найти в [36], [37]. В частности, Бончев [37] сравнил колмогоровскую сложность графа с другими мерами и занялся вопросом, могут ли все эти методы обнаруживать ветвление в графах.
Основная цель этой статьи состоит в том, чтобы представить сетевую меру, называемую оценкой сетевого разнообразия , и продемонстрировать, что эта мера позволяет классифицировать сети в соответствии с их структурной сложностью. В частности, мы демонстрируем, что оценка разнообразия позволяет отличать упорядоченные, случайные и сложные сети друг от друга. Кроме того, мы изучаем 16 дополнительных показателей сложности сети и обнаруживаем, что ни один из этих показателей не обладает такими же хорошими возможностями категоризации в отношении структурной сложности сетей.В отличие от многих других мер, предложенных до сих пор, оценка сетевого разнообразия отличается по целому ряду причин. Во-первых, наша оценка мультипликативно состоит из четырех отдельных оценок, каждая из которых оценивает различные структурные свойства сети. Это означает, что наша общая оценка отражает структурное разнообразие сети. Абстрактно это можно рассматривать как измерение сложности сети. Во-вторых, наша оценка определяется для совокупности сетей, а не для отдельных сетей. Мы покажем, что это устраняет нежелательную двусмысленность, присущую показателям, основанным на отдельных сетях.Чтобы обеспечить практическое применение показателя сетевого разнообразия, мы предоставляем статистическую оценку для этого показателя, основанную на конечном числе сетей, выбранных из основной совокупности сетей.
Этот документ организован следующим образом. Поскольку определение структурной сложности сетей сталкивается с теми же проблемами, что и для одномерных строк символов, было предложено несколько эвристических критериев, которым должна соответствовать мера сложности [25], [27]. Чтобы прояснить, что мы подразумеваем под сложной сетью , мы приводим в разделе «Характеризация сложности сетей» ее описание, на которое мы опираемся в этой статье.Затем мы опишем 16 показателей сложности сети, использованных для нашего анализа, и охарактеризуем их вычислительную сложность. Чтобы представить меры сетевой сложности, используемые в этой статье, мы грубо разделим их на два класса: информационно-теоретические и неинформационно-теоретические меры. Понятно, что каждую группу можно разделить на подкатегории. Например, мы могли бы отнести класс чисто основанных на расстоянии и основанных на собственных значениях мер к категории неинформационно-теоретических мер.Как известно, информационно-теоретические меры сложности графа [23], [38] основаны на выводе распределения вероятностей с учетом структурных особенностей графа. Точнее, с помощью энтропии Шеннона можно получить так называемые меры, основанные на разбиении, и меры, не основанные на разбиении, см. [23], [39]. Другие меры энтропии графа, основанные на использовании отношений подграфа, можно найти в [28]. Неинформационно-теоретические меры сложности в основном основаны на преобразовании простых инвариантов графа, таких как степени вершин и величины, основанные на расстоянии [40], в действительные числа [41], [42].Например, первый индекс загреба [41], [42] преобразует степени вершин в положительную меру для характеристики структуры графа. Другой класс неинформационно-теоретических мер сложности основан на получении подграфов и последующем преобразовании их в меры, которые в конечном итоге приводят к мере сложности графа, см. [28]. В разделе «Оценка сетевого разнообразия» мы определяем нашу меру и разъясняем концептуальные отличия от других подходов. В разделе результатов мы исследуем все 17 сетевых показателей для различных настроек и сравниваем их друг с другом.Статья завершается разделом «Заключение», в котором подводятся итоги полученных результатов.
Методы
В этом разделе мы, во-первых, даем характеристику сложности сетей, используемую в этой статье. Затем мы описываем 16 показателей сложности сети, которые мы используем в нашем анализе, и характеризуем их вычислительную сложность. После этого мы вводим новый показатель сложности, называемый показателем сетевого разнообразия (NDS), и обосновываем его определение.
Характеристика сложности сетей
Как отмечалось во введении, до сих пор не существует общепринятого определения сложности, применимого к общим объектам, включая сети. Однако обычно считается, что мера сложности должна быть способна отличать сложные объекты от случайных и упорядоченных объектов. Для объектов, порожденных физическим процессом, эта характеристика сложности дана в [4], [19]. Однако аналогичные утверждения были сделаны и для сложности биологических систем [43].В дальнейшем мы принимаем эту точку зрения. На рис. 1А представлена визуализация этой характеристики в контексте сетей. На этом рисунке ось x соответствует одномерной переменной, которая представляет сети G из сетевого пространства, а ось y дает значение меры сложности . Здесь предполагается, что переменная q гладко представляет сети подобного типа. Вот почему определенные области оси x были помечены как упорядоченные, сложные или случайные.Конкретными примерами такой переменной являются расчет Лэнгтона [44] для одномерных клеточных автоматов или средняя связность K в случайных булевых сетях [45].
Важно прояснить связь между тремя различными объектами: сетью G , переменной q , представляющей сеть, и мерой сложности M . Сеть — это абстрактный объект, который обладает множеством различных свойств, например, числом узлов, распределением степеней, средней длиной пути между всеми узлами, и это лишь некоторые из них.По этой причине сеть нелегко измерить одной переменной, потому что отображение обычно не уникально. Например, если мы идентифицируем с (глобальным) коэффициентом кластеризации сети G [46], то есть много сетей, которые имеют одинаковое значение q . По этой причине, когда кто-либо отображает сеть G в q , значение q фактически представляет собой набор сетей, которые отображаются в одно и то же значение q , т. е. с . Аналогичные аргументы справедливы, когда мы сопоставляем сеть со значением ее сложности, т.е.э., . Также в этом случае, как правило, многие сети сопоставляются с одним и тем же значением сложности, с . Интересно отметить, что после того, как сети были идентифицированы как сложные , случайные или упорядоченные , с помощью меры сложности M сущность q может служить мерой сложности, если она демонстрирует свойство гладкости по отношению к базовым сетям. Здесь гладкость означает, что аналогичные сети приводят к аналогичным значениям q .Это свойство гладкости позволяет идентифицировать непрерывные области (интервалы) значений q , которые представляют определенные типы сетей, как показано на рис. 1 A.
Конкретная проблема, которую мы хотим изучить в этой статье, отличается от приведенной выше. Вместо того, чтобы использовать меру сложности M для категоризации сетей на группы комплексные, случайные или упорядоченные, мы предполагаем, что такая категоризация для сетей уже известна. Из приведенного выше обсуждения мы знаем, что если мы найдем гладкую меру, представляющую наборы сетей, которая присваивает схожим типам сетей одинаковые значения q , то q может служить мерой сложности.Это означает, что для сетей, размеченных в соответствии с определенными категориями, к которым они принадлежат, и мерой q можно количественно оценить качество такой меры по отношению к заданным меткам сетей. Следовательно, используя знания о маркировке различных сетей, мы можем исследовать возможности категоризации меры q .
На рис. 1Б показано альтернативное поведение меры сложности в зависимости от сетей. В этом случае мы назвали значения на оси и «оценкой», а не мерой сложности, потому что здесь оценка для сложных сетей приводит не к максимально возможным значениям, а к промежуточным значениям.Однако преимущество такой оценки по сравнению с оценками, показанными на рис. 1А, заключается в том, что она позволяет проводить различие между всеми тремя типами сетей, сложными, упорядоченными и случайными сетями, учитывая только оценку сетей. Следовательно, существуют три непрерывных области значений показателя, которые позволяют однозначно различать три типа сетей. Другие конфигурации могут быть возможны и полезны, однако в дальнейшем мы основываем наш анализ на этой базовой характеристике сложности и применяем ее к сетям.Как продемонстрируют наши численные результаты, принципиальное поведение показателя, изображенного на рис. 1В, имеет практическое значение для нашего анализа (см. рис. 8 и его обсуждение).
Определение показателей сложности
Далее мы даем краткое описание мер сложности, которые мы используем в нашем исследовании. Обозначим через G сеть, имеющую множество вершин V и множество ребер E . Количество вершин и количество ребер . В таблице 1 представлен обзор 16 показателей сложности, которые мы используем.
Теоретико-информационные меры сложности.
Для структурной характеристики сетей было разработано множество энтропийных мер, определяющих их структурное информационное содержание [38]. Следующие меры основаны на энтропии Шеннона.
- Содержание топологической информации:
Одной из первых мер была введенная Рашевским [58] топологическая информативность (1)
Здесь обозначает количество топологически эквивалентных вершин в i -й вершинной орбите G , а k — количество различных орбит. является мерой симметрии в графах. Эта мера равна нулю для полностью симметричного графа, такого как регулярный граф, и достигает максимального значения для асимметричного графа. Важно отметить, что Трукко [59] также исследовал эту меру, а Мовшовиц [56] обобщил ее для определения структурной информативности графов и изучил их математические свойства [56], [60], [61].
Более общая мера сложности графа принадлежит Бертцу и выражает общее структурное информационное содержание графа: (2)
X — произвольный инвариант графа, такой как его вершины, ребра, степени и т. д.относится к его мощности. Например, если X соответствует вершинам сети, то соответствует количеству вершин. Если мы выберем , мы получим (3)
как частный случай.
- Индекс Бончева-Тринайстича:
Определяя взвешенные вероятностные схемы, обобщаются классические меры Рашевского и Мовшовица [56], [58], см. уравнение. 1. Специальная мера предусмотрена (4)
.Этот показатель основан на индексе Винера [57],(5)
Обратите внимание, что индекс Винера представляет собой сумму всех расстояний в графе G .Расстояния можно вычислить с помощью алгоритма Дейкстры или любого другого метода вычисления кратчайших путей в графе [62], [63]. Здесь – диаметр сети G , а – количество кратчайших путей длиной i .
- Информационно-теоретическая мера сложности, основанная на информационных функционалах:
Следующая мера относится к семейству энтропийных мер графа, основанных на использовании информационных функционалов [39].Его специальной мерой является индекс ассоциации степень-степень, так как он основан на специальном информационном функционале, см. [52]. Функционал определяется (6)
Подробное объяснение и определение можно найти в [52]. Индекс ассоциации степени-степени определяется (7)
.— константа масштабирования. Обратите внимание, что это не основано на определении разделения элементов графа в классическом смысле (например, ), поскольку значения вероятности присваиваются каждой вершине G .
Чтобы определить внедиагональную сложность () [54], пусть будет матрицей корреляции вершин-вершин, см. [54].обозначает число всех соседей, обладающих степенью всех вершин со степенью i [28]. обозначает максимальную степень G . Если определить [28](8)
и (9)
можно определить как [28](10)
- связующее дерево Чувствительность:
Следующая мера основана на определении подструктур на графиках. Чувствительность остовного дерева [28] определяется формулой (11) с , , и представляет собой упорядоченный список всех k различных .это количество остовных деревьев в графе минус количество остовных деревьев подграфа с удаленным ребром. Аналогично, мера различий чувствительности связующего дерева определяется как (12) с , где упорядоченный список всех уникальных различий .
Неинформационно-теоретические меры сложности.
Неинформационно-теоретические меры сложности для сетей могут быть определены с использованием произвольных инвариантов графа, таких как расстояния между узлами или их степени. Ниже мы опишем некоторые важные меры, которые уже использовались в различных дисциплинах.
Индекс Balaban J определяется как [42], [47](13)
обозначает сумму расстояний от вершины до всех других вершин, т. е. (14), тогда как D — матрица расстояний, содержащая длины кратчайших путей между всеми вершинами, измеренные расстоянием Дейкстры [63], и является цикломатическим числом [64] .
Индекс сложности B является недавно разработанной мерой благодаря Бончеву [24]:(15)
где(16)
Здесь – степень вершины.
Латора и др. [49], [50] разработали меру, называемую эффективностью сложности графа G . Начиная с (17)
, выражающее среднее арифметическое всех обратных длин пути и (18)
Эффективность сложности уступает(19)
В общем, измерения на основе расстояния легко вычисляются с полиномиальной временной сложностью [62]. Поэтому для характеристики сетей на основе их топологии были разработаны различные индексы на основе расстояния [40], [65].Среднее отклонение расстояния, введенное Скоробогатовым и Добрыниным, определяется как [40], [42]:(20)
где(21)
и (22)
- Нормализованная сложность ребра:
Нормализованная реберная сложность с использованием элементов матрицы смежности была введена Бончевым [24]:(23)
, где (24)
Здесь обозначает запись в i -й строке и j -м столбце соответствующей матрицы смежности A .
- Индекс подключения Рандича:
Индекс связности Рэндича [55](25) успешно использовался в качестве индекса ветвления. Кроме того, R широко исследовался, например, границы и другие экстремальные свойства были исследованы междисциплинарным образом [66].
Одним из первых дескрипторов структурных графов был индекс Винера [57],(26)
обозначает кратчайшее расстояние между и .
Классическим индексом на основе степени, основанным на степени вершины, является первый индекс Загреба [41], [42], определяемый как (27)
— это просто сумма степеней вершин G .
Вычислительная сложность
Вычисление сложности сетей может потребовать значительных вычислительных ресурсов, и многие алгоритмы являются даже NP-полными [68]. Например, определение группы автоморфизмов общего графа для вычисления меры энтропии графа требует больших вычислительных ресурсов, поскольку вычислительная сложность может быть экспоненциальной [69].Напротив, временная сложность некоторых информационно-теоретических мер сложности графов, таких как B , OdC, полиномиальна, см. [70]. В частности, временная сложность индекса Бончева-Тринайстича и индекса ассоциации степени-степени такова, что нам нужно вычислить все кратчайшие пути между всеми вершинами в графе, ведущие к . Аналогичные утверждения [28], [70] для временной сложности J и могут быть получены, поскольку необходимо вычислить полную матрицу расстояний. Простые топологические сетевые меры, такие как индекс Винера и Рэндича, также обладают полиномиальной временной сложностью, поскольку их вычисление основано на матричных вычислениях на основе инвариантов графа.
Временная сложность определения нулей (собственных значений) [71] графовых полиномов [51], таких как характеристический или дистанционный полином, также является полиномиальной. Например, используя матрицу смежности для вычисления характеристического многочлена графа, мы получаем его собственные значения за полиномиальное время.Исходя из этого, можно эффективно рассчитать такие меры, как энергия графика E и энергия лапласиана LE .
Показатель разнообразия сети
Далее мы определяем сетевой показатель, который мы называем показателем сетевого разнообразия (NDS). Наша оценка основана на 4 переменных: (30) (31) (32) (33)
Здесь M — количество модулей в сети G и n — количество вершин этой сети. Вектор содержит размеры модулей, т.е.е., дает размер i-го модуля, который соответствует количеству узлов в этом модуле. Для идентификации модулей в сети мы используем метод под названием Walktrap [72], который находит модули на основе случайных блужданий, подобных [73], [74]. Преимуществом этого метода перед многими другими является его эффективная вычислительная сложность, определяемая как (e: количество ребер, n: количество вершин). Вектор в уравнении 32 представлены собственные значения матрицы Лапласа L сети G [75], компоненты которой определяются формулой (34)
Здесь степень узла i в G .Наконец, и соответствуют числу мотивов размера 3 и 4, обнаруженных в сети G [76]. Это означает количество различных мотивов, которые можно найти в G , имеющих i узлов.
На основе вышеуказанных четырех переменных мы определяем индивидуальный показатель разнообразия для сети G как (35)
Мы называем этот показатель показателем индивидуального разнообразия , поскольку его можно рассчитать для одной сети G . Индивидуальная оценка разнообразия оценивает одну сеть G и принимает значения в .Основываясь на этом, мы определяем показатель сетевого разнообразия (NDS), , для совокупности сетей как (36)
Здесь обозначает совокупность сетей, принадлежащих к одной сетевой модели, и является плотностью вероятности для этой совокупности. Например, это может соответствовать модели случайной сети, созданной с помощью модели Эрдеша-Рейни [77], [78]. Или это может быть набор всех безмасштабных сетей, сгенерированных с помощью алгоритма преимущественного присоединения [79], [80]. Или популяция может содержать все сети, имеющие одинаковую степень, т.е.г., решетка с периодическими краевыми условиями. Это означает, что популяция сетей может быть определена либо случайным процессом, порождающим сети в популяции, либо структурными свойствами самих сетей.
Чтобы получить аппроксимацию меры , которая может быть применена к конечному набору сетей, мы определяем показатель разнообразия сети для выборки размера из населения с помощью оценщика, (37)
Предполагая, что S сетей независимо выбираются из совокупности, тогда, согласно центральной предельной теореме [81],(38)
Для наших численных исследований мы используем оценку, приведенную в уравнении. 37.
Показатель разнообразия отражает идею о том, что сеть является многомерным объектом. В частности, мы рассматриваем 4 переменные и как важные. Переменная предоставляет информацию о плотности модулей сети. Для сложных сетей мы ожидаем найти больше модулей, чем для случайных сетей, потому что модули являются выражением общего принципа организации сети. Переменная представляет собой скорость роста мотивов в сети. Из численных результатов мы заметили, что упорядоченные сети имеют самые высокие значения, сложные сети имеют промежуточные значения, а случайные сети имеют самые низкие значения .Эта переменная аналогична значению CV (коэффициент вариации), которое измеряет изменчивость размеров сети по отношению к среднему размеру модуля. Ожидается, что случайные сети будут иметь низкую изменчивость размеров модулей, но также и низкий средний размер модуля, тогда как сложные сети должны иметь более высокую изменчивость размеров модулей, но также и более высокий средний размер модуля. Переменная аналогична, но для собственных значений матрицы Лапласа L . Мы изучили множество комбинаций этих 4 и других переменных и в результате численных исследований обнаружили, что показатель индивидуальной плотности в уравнении35 приводит к лучшему разделению случайных, сложных и упорядоченных сетей.
Мотивация для оценки сетевого разнообразия.
Логическое обоснование нашей меры основано на следующих наблюдениях. Во-первых, исследования сложности различных типов объектов, например одномерных струн, привели к введению большого количества различных мер сложности. Однако до сих пор нет единого мнения о том, что правая мера входит в число введенных.Что касается сетей, мы сталкиваемся с аналогичной ситуацией, которая потенциально может быть еще более серьезной. По этой причине мы предлагаем составную меру, основанную не только на оценке одного структурного принципа, но и на комбинации нескольких. Следовательно, их комбинаторное использование уменьшает потребность в том, чтобы каждая отдельная мера представляла правильную меру сложности. В разделе результатов мы численно продемонстрируем, что такая составная мера на самом деле приводит к очень хорошим результатам.
Вторую причину, побудившую нас ввести нашу меру, лучше всего описывает следующая иллюстрация. Предположим, кто-то определяет сети как «случайные», когда они были сгенерированы с помощью модели случайных сетей, предложенной Эрдёшем-Рейни и Гилбертом [77], [78], и как «сложные», когда они были сгенерированы с помощью алгоритма предпочтительного присоединения. [79], [80]. Тогда существует ненулевая вероятность сгенерировать случайную сеть со случайной сетевой моделью, которая также является сложной.Однако это противоречит здравому смыслу. Рассмотрим пример для этой задачи. Предположим, что сеть была сгенерирована с помощью модели случайной сети, а вторая сеть сгенерирована с помощью алгоритма предпочтительного подключения. Тогда с определенной вероятностью (со смыслом ) выполняется, поскольку случайная сетевая модель в принципе может генерировать все возможные сетевые структуры. Точнее, если неориентированная сеть содержит e ребер (обозначенных ) и n вершин, то она содержит недостающие ребра (неребра).Это означает, что вероятность w случайной сетевой модели сгенерировать конкретную сеть с e ребер определяется как (39)
Здесь – вероятность иметь e ребер в , а – вероятность не иметь ребер в . Это означает, что присвоение значения сложности отдельным сетям приводит к потере уникальной связи между сложностью сети и базовой моделью сети, которая создала эту сеть. Это визуализируется на рис.2 A. На этом рисунке w соответствует вероятности того, что модель случайной сети генерирует сложную сеть. Начиная со значения сложности сети в правой части рисунка, можно сделать вывод, что она была сгенерирована либо с помощью случайной сетевой модели, либо с помощью сложной сетевой модели. Из соображений простоты мы использовали в приведенном выше объяснении только две сетевые модели, однако расширение на большее количество моделей является прямым, но делает объяснения более трудоемкими. Должно быть ясно, что в таком расширенном сценарии вероятность неоднозначности между сложностью отдельных сетей и моделями генерации сети даже увеличивается.
Рисунок 2. Связь между сетевой моделью, сетями и мерой сложности, оценивающей либо сложность отдельных сетей (A), либо совокупность сетей (B), либо выборку сетей (C).
https://doi.org/10.1371/journal.pone.0034523.g002
Чтобы избежать этой проблемы, мы основываем нашу оценку сети на принципе, представленном на рис.2 B. Из-за того, что сложность оценивается для совокупности сетей , сгенерированных сетевой моделью, нет путаницы в отношении базовой сетевой модели, которая сгенерировала совокупность, поскольку мера сложности может основываться на информации обеспечивается всем населением, а не только его экземпляром. На практике мы аппроксимируем такую меру населения, используя конечную выборку сетей, как показано на рис. 2C. Для конечной выборки, состоящей из S сетей, также существует ненулевая вероятность получения неоднозначной связи между сложность и базовая сетевая модель, которая сгенерировала образец сети, визуализированный на рис. 2 C. Однако эта вероятность составляет всего , по сравнению с w для меры сложности, основанной на одной сети. В пределе для этого вероятность стремится к нулю и модель C становится моделью B для любого . Следовательно, использование выборки размером × снижает вероятность неоднозначности, ведущей к ошибочной классификации, в 0 раз. Например, если и объем выборки равен только , то этот фактор уже равен .
Мы хотели бы подчеркнуть, что приведенные выше объяснения служат мотивацией нашего подхода, а не числовым анализом самой общей мыслимой ситуации.В этом отношении вероятность w , приведенная в уравнении. 39 необходимо адаптировать для более общих ситуаций. Однако, независимо от его точного значения, w всегда будет больше нуля, и приведенное выше принципиальное обсуждение плавно переводится в более сложные условия. В следующем разделе мы обеспечим численный анализ большого количества различных сетей.
Результаты
Мы начнем наш анализ с изучения статистической изменчивости 16 показателей сложности сети, перечисленных в табл. 1. На рис. 3 показаны результаты для 100 сетей, сгенерированных с использованием модели случайных сетей [77], [78] для параметров и . Здесь n соответствует количеству узлов в сети, а параметром является вероятность того, что два узла соединены ребром. Каждая гистограмма показывает результат для одной меры сложности, на что указывает имя в легенде. Ось x соответствует значению соответствующей меры сложности, а ось y дает частоту наблюдаемых значений.Важно отметить, что, несмотря на то, что все случайные сети были сгенерированы для одних и тех же сетевых параметров, n и , результирующие меры сложности не дают идентичных результатов, а колеблются. Мы повторили этот анализ для разных параметров модели случайной сети, а также для разных типов сетей, т. е. для сложных сетей. Для всех исследованных случаев мы получили качественно схожие результаты. Это выявляет общий концептуальный недостаток всех этих сетевых показателей, поскольку ни один из показателей не рассматривается как случайная величина. Однако из-за того, что сеть выбирается из базовой совокупности, эта сеть различается структурно, а, следовательно, и мерой сети, как видно на рис. 3. Это означает, что игнорирование этого факта контрпродуктивно и приводит к потере интерпретируемости этих сетевых показателей, как будет продемонстрировано далее в этом разделе (см. рис. 7). Как объяснялось в разделе «Оценка сетевого разнообразия», случайная сетевая модель в принципе способна генерировать все возможные типы сетей, включая упорядоченные и сложные сети, однако только с определенной вероятностью.Из-за того, что все меры оценивают только одну сеть, которая была случайным образом выбрана из базовой совокупности сетевой модели, выборочная сеть передает изменчивость сетевых структур совокупности самой сетевой мере.
На рис. На рисунках с 4 по 5 показаны результаты для двух разных сетевых моделей и влияние параметров модели на 16 показателей сложности. На рис. 4 показаны результаты для модели случайной сети с вероятностью соединения между узлами (ось x ). На рис. 5 показаны результаты для модели сети малого мира [82] для вероятности повторного подключения (оси x ). На этих рисунках среднее значение и стандартное отклонение показателя сложности (ось Y) показаны в зависимости от параметра модели (ось x ).
На рис. 4 видно, что среди 16 мер сложности можно наблюдать четыре качественно различных типа поведения. Четыре наблюдаемых поведения: (1) монотонное увеличение значения сложности (complexityIndexB, эффективность, энергия, lapEnergy, randic, sTreeSens, tInfoContent, zagreb1), (2) монотонное уменьшение значения сложности (infoTheoGCM), (3 ) увеличение значений сложности с последующим уменьшением значений (bonchev2, mDistDev, wiener), (4) снижение значений сложности с последующим увеличением значений (balabanJ, nEdgeComplexity, offdiagonal).Это указывает на то, что разные сетевые показатели имеют совершенно разные характеристики из-за разных структурных особенностей сети, которую они фиксируют. Кроме того, мы наблюдаем, что все меры, кроме infoTheoGCM, приводят к неперекрывающимся значениям для разных параметров модели, что означает, что разные значения приводят к значительно разным значениям соответствующих значений сложности. Это важно отметить, поскольку все сети, сгенерированные с помощью модели случайных сетей для разных значений, являются случайными сетями.
Результаты для модели сети малого мира, показанные на рис. 5, принципиально отличаются от результатов, показанных на рис. 4, поскольку при разных значениях мы получаем разные типы сетей. В частности, мы получаем упорядоченные (), комплексные () и случайные сети (). Это отличается от результатов для модели случайной сети, потому что разные параметры модели всегда приводят к случайной сети, тогда как для модели сети малого мира разные параметры модели приводят к другому типу сети.Среди 16 сетевых показателей 5 демонстрируют дискриминационное поведение по отношению к трем различным типам сетей (balabanJ,сложностьIndexB,энергия,mDistDev и sTreeSens). Это означает, что эти 5 показателей показывают для сложных сетей () заметно разные значения, чем для упорядоченных и случайных сетей.
На рис. 6 показаны результаты о влиянии размера сети n в диапазоне от 100 до 500 узлов на показатели сложности. Поскольку тип сети не меняется при изменении размера сети, можно было бы ожидать , в идеале , постоянных значений показателей сети для всех размеров сети.Единственными мерами, которые являются приблизительно постоянными, являются недиагональные и sTreeSens, потому что их средние значения сложности не сильно меняются, если принять во внимание стандартное отклонение меры. На все остальные показатели в значительной степени влияет размер сетей. Это намекает на то, что размер сети является важным параметром. Чтобы упростить последующий анализ, мы изучаем только сети фиксированного размера.
До сих пор мы изучали только отдельные модели сетей для множества различных параметров, от которых эти модели зависят.Теперь мы исследуем смесь различных сетевых моделей. Более конкретно, мы генерируем множество, состоящее из 1500 сетей, каждая из которых имеет вершины. Этот набор состоит из 200 упорядоченных сетей, 600 случайных сетей и 700 сложных сетей. Набор сложных сетей сам по себе представляет собой смесь безмасштабных сетей с различными параметрами мощности модели предпочтительного подключения и сетей малого мира с вероятностью переподключения . Для множества случайных сетей мы использовали разные параметры соединения вершин ребром, а именно .Кроме того, мы сгенерировали случайные сети с моделью маленького мира, установив вероятность повторного подключения на 1,0. Это означает, что результирующий набор сетей неоднороден по отношению к поколению используемых сетей. Среднее количество ребер этих наборов упорядоченных, случайных и сложных сетей составляет 200 для каждого типа сети, а их стандартное отклонение составляет 109, 43 и 60. Тот же набор данных будет позже использоваться для изучения показателя сетевого разнообразия (см. рис. 8).
Применение 16 мер сложности приводит к результатам, показанным на рис.7. На этих рисунках показана плотность вероятности значений сложности (ось y ) в зависимости от значений сложности сетей (ось х ). Три разных цвета соответствуют упорядоченным (красный), сложным (фиолетовый) и случайным (зеленый) сетям. Идеальным поведением меры сложности, которую мы хотели бы наблюдать, является разделение трех различных типов сетей, что означает, что плотность значений сложности для упорядоченных, сложных и случайных сетей должна лишь незначительно перекрываться, чтобы обеспечить осмысленную категоризацию трех типов. типы сети.Рассматривая с этой точки зрения полученные численные результаты на рис. 7, мы обнаруживаем, что только внедиагональная сложность позволяет, по крайней мере, в определенной степени отделить три типа сетей друг от друга. Плотности всех остальных мер вообще не разделяются. Проблема с плотностью недиагональной сложности заключается не только в том, что она бимодальна для сложных сетей, но и в том, что все еще существует значительное перекрытие сложных (фиолетовый) и случайных сетей (красный).
Рисунок 8.Плотность показателя разнообразия для упорядоченных (красный), сложных (фиолетовый) и случайных (зеленый) сетей.
В первой строке показаны результаты для сетей с узлами, а во второй строке — для узлов. Четыре столбца соответствуют четырем размерам выборки.
https://doi.org/10.1371/journal.pone.0034523.g008
Затем мы исследуем поведение показателя разнообразия сети, заданного в уравнении. 37. В верхнем ряду на рис. 8 показаны результаты применения показателя разнообразия к . Из-за того, что наша оценка сложности зависит от размера выборки S , четыре столбца на рис. 8 соответствуют четырем разным размерам выборки (). Следовательно, количество различных сетей, используемых для этих четырех случаев, равно количеству сетей. Мы хотели бы подчеркнуть, что для оценка дает наихудшее возможное приближение для показателя плотности . Этот случай не включен, чтобы предположить, что это потенциальный выбор S , вместо этого он включен, чтобы продемонстрировать силу эффекта совокупности для значений .По этой причине мы подчеркиваем отличие этого случая от других, обрамляя первый столбец на рис. 8 синим прямоугольником, чтобы показать, что это не предполагаемое значение размера выборки.
Из рис. 8 видно, что при увеличении значений объема выборки S три типа сетей — упорядоченные сети (красные), сложные сети (фиолетовые) и случайные сети (зеленые), соответственно их плотности становятся все больше и больше отделены друг от друга по желанию. Но даже для размера выборки результаты оценки разнообразия улучшаются по сравнению с недиагональной сложностью, которая была самой эффективной мерой из всех 16 сетевых показателей. Однако вторая строка на рис. 8 показывает аналогичный анализ для сетей, имеющих узлы, для которых мы сгенерировали другой набор сетей, содержащих сети. Ибо мы наблюдаем еще более четкое различие трех типов сетей, которые совершенно отделены друг от друга. Мы хотели бы подчеркнуть, что из-за характера показателя сетевого разнообразия, который основан на популяции, сравнение с любым из 16 сетевых показателей будет неравномерным, поскольку размер выборки S не может повлиять ни на один из этих показателей.С другой стороны, выборка сетей размером × содержит ценную информацию, которую можно использовать для повышения различительной способности меры, как показано на рис. 8. Это свидетельствует о том, что концептуальная идея меры, основанной на совокупности, предложенный в этой статье, повышает эффективность меры по разделению сетей из разных категорий.
В качестве предостережения мы хотели бы подчеркнуть, что различающая способность показателя разнообразия составляет не только из-за его популяционного характера, вместо этого она обусловлена сочетанием его популяционного характера и индивидуального показателя разнообразия , , (см.35), на котором основан. Из рис. 8 можно узнать о влиянии размера выборки, но он не дает информации о влиянии показателей индивидуального разнообразия . По этой причине мы исследовали влияние показателя индивидуального разнообразия на , изменив его определение. Например, используя только подмножество из четырех переменных, на которых основывается (см. уравнения 30–33), мы обнаружили, что основанная на совокупности версия такой меры фактически не приводит к различению различных типов сетей.Таким образом, только сочетание соответствующего индивидуального показателя разнообразия с популяционным подходом приводит к благоприятным характеристикам показателя разнообразия.
В разделе «Характеристика сложности сетей» мы привели характеристику сложности. Связь между этой характеристикой, приведенной на рис. 1, и нашими результатами на рис. 8, задается кумулятивной функцией распределения (CDF) [81] плотностей на рис. 8. В качестве примера мы показываем CDF для и .Следовательно, оценка ( y — ось) на рис. 1 может быть отождествлена с кумулятивной функцией распределения плотности вероятности оценки разнообразия.
Наконец, мы показываем на рис. 9 влияние размера выборки S на средний показатель индивидуального разнообразия, соответствующий , для сетей размера . Эти результаты показывают, что это среднее значение в значительной степени постоянно для различных значений размера выборки S , демонстрируя, что несмещенная оценка [83], заданная уравнением.37 дает хорошие практические оценки даже для небольших размеров выборки. Кроме того, этот рисунок показывает, что очень маленькие размеры выборки не рекомендуется использовать, поскольку ожидаемая изменчивость оценок довольно велика.
Приложение к реальным сетям
Наконец, мы применяем оценку сетевого разнообразия к четырем реальным сетям. Мы используем две социальные сети, представляющие сети соавторства между учеными, работающими в области физики высоких энергий (hep, ) [84] и network science (net, ) [85], технологическую сеть, представляющую энергосистему западных штатов США (power, ) [82] и биологической сети, представляющей белок-белковые взаимодействия в Helicobacter pylori (hpylo, ) [86], которая является бактерией, которую можно найти в желудке.Число в скобках относится к количеству узлов в гигантском связанном компоненте этих сетей, которые мы используем в дальнейшем для нашего анализа.
Поскольку у нас есть только одна сеть для каждой из этих четырех сетей, к которой мы можем применить оценку сетевого разнообразия, мы используем следующее свойство сложности. Обычно считается, что одним из аспектов сложности объекта является наличие иерархической организационной структуры [10], [87], [88]. Отсюда следует, что сложен не только сам объект в целом, но и достаточно крупные его составляющие.Для нашего анализа мы используем это, случайным образом выбирая подсети из сети G . Это означает, что мы получаем выборку из S сетей из одной сети, генерируя случайным образом подсети с n вершинами из G . Таким образом, мы получаем выборку сетей , тогда как каждая сеть была выбрана из сети G , т. е. (40)
, который аппроксимирует выборку базовой модели сети. Практически мы генерируем подсети случайным блужданием.Начиная с начальной вершины, выбранной случайным образом из всех вершин сети, подсеть определяется первыми уникальными вершинами, посещенными случайным блужданием. Это позволяет, во-первых, сгенерировать выборку сетей из сетевой модели, хотя доступна только одна сеть. Во-вторых, размер каждой сети может быть установлен равным фиксированному значению n . Это позволяет сравнивать сети разного размера, поскольку размеры сетей в выборках имеют все одинаковое количество вершин.
На рис. 10 показаны результаты для этих четырех сетей. Кроме того, мы включили результаты для случайных сетей (красная кривая), сгенерированных с помощью модели Эрдёша-Рейни. Ось x дает размер подсетей, n . Размер выборки для этого анализа был равен, и мы усреднили все результаты по 100 независимым выборкам. Это означает, что для рис. 10 мы проанализировали все сети. В целом можно видеть, что случайные сети приводят к самым низким значениям показателя плотности, а для подсетей такого размера расстояния между отдельными сетями в основном постоянны.Это указывает на то, что для изучаемых сетей размеры подсетей достаточно велики, чтобы охватить сложность всей сети.
Обсуждение
В этой статье мы исследовали поведение 17 сетевых показателей в отношении их способности систематически классифицировать структурную сложность сетей. Наш анализ показывает, что построение сетевой меры таким образом, чтобы она усреднялась по выборке сетей из совокупности, значительно расширяет ее возможности для классификации различных типов сетей. Из наших численных результатов следует, что это свойство усреднения оценки разнообразия является ключевым для достижения идеального разделения трех различных типов сетей, упорядоченных, сложных и случайных сетей, которые мы исследовали в нашем анализе. Важным моментом здесь является то, что это свойство усреднения снижает важность нахождения правильной сетевой меры, которая точно определяет то, что подразумевается под структурной сложностью сети. Из-за того, что мера сложности сети right неизвестна, мы определили показатель разнообразия, мультипликативно состоящий из четырех отдельных показателей, каждый из которых оценивает различные структурные свойства сети.Таким образом, комбинация оценки сетевого разнообразия, которая фокусируется не на одном структурном свойстве сети, а на нескольких, вместе с усреднением по выборке сетей из совокупности приводит к сетевому показателю, который выглядит хорошо. принялся за предложенную задачу. Мы хотели бы подчеркнуть, что существуют и другие меры сложности, которые также включают базовую совокупность в определение меры [14], [16], [17], [21], [22], однако все эти меры сложности изучались только в контексте последовательностей символов.
С теоретической точки зрения, усреднение по выборке сетей из совокупности не только оказывает очень благоприятное влияние на численную категоризацию различных типов сетей, но также устраняет концептуальную неопределенность, присутствующую во всех мерах, которые оценивают только отдельные сети с относительно их сложности. Как обсуждалось в разделе «Методы», модель случайной сети также способна генерировать сложные сети. Следовательно, теоретически возможно генерировать различные типы сетей с помощью модели случайной сети.Это неизбежно приводит к неправильной классификации сетей. Напротив, оценка разнообразия, предложенная в этой статье, уменьшает эту неоднозначность в 0 раз, где S соответствует размеру выборки.
Классификация сетей по их структурной сложности интересна не только по теоретическим, но и по практическим причинам. Например, в молекулярной биологии принято считать, что молекулярные взаимодействия между белками и молекулами порождают биологическую функцию клеток и обусловливают фенотипический облик организмов. В связи с тем, что графическое представление таких молекулярных взаимодействий дают генные сети, было предложено сравнивать эти сети структурно для выявления аберраций молекулярных функций [89]–[91]. В качестве расширения описанного выше подхода кажется естественным оценивать структурную сложность генных сетей, например, регуляторных сетей, чтобы различать разные стадии сложных заболеваний, таких как рак или сердечно-сосудистые заболевания, друг от друга. Например, данные об экспрессии генов из ДНК-микрочипов можно использовать для определения регуляторной сети для каждого пациента, относящегося к определенной стадии или степени заболевания.Тогда такую степень заболевания можно рассматривать как категорию, из которой отбираются пациенты и их соответствующие сети. Таким образом, нашу сетевую оценку можно применять для сравнения пациентов с разными стадиями или классами заболевания друг с другом. Учитывая скорость, с которой данные в молекулярной биологии увеличиваются благодаря постоянным технологическим инновациям, можно ожидать, что такие наборы данных будут доступны в ближайшем будущем. Другими потенциальными областями применения являются категоризация финансовых сетей [92]–[94] или нейронных сетей [95], [96].
Благодарности
Мы хотели бы поблагодарить Рикардо де Матоса Симоеса, Шайлеша Трипати и Джона Квакенбуша за плодотворные обсуждения. Для численного моделирования мы использовали R [97] и пакет QuACN [98].
Авторские взносы
Идея и дизайн экспериментов: ФЭС МД. Выполняли эксперименты: ФЭС МД. Проанализированы данные: ФЭС МД. Предоставленные реагенты/материалы/инструменты для анализа: FES MD. Написал статью: ФЭС МД.
Каталожные номера
- 1.Бар-Ям Ю. (1997) Динамика сложных систем. Книги Персея.
- 2. Чайтин Г. (1966) О длине программ для вычисления конечных двоичных последовательностей. Журнал АКМ. стр. 547–569.
- 3. Колмогоров А.Н. (1965) Три подхода к количественному определению понятия «информация». Проблемы передачи информации 1: 1–7.
- 4. Лопес-Руиза Р. , Мансиниб Х., Кальбет Х (1995) Статистическая мера сложности. Письма по физике A 209: 321–326.
- 5. Николис Г., Пригожин I (1989) Изучение сложности. Фриман.
- 6. Прокопенко М., Боскетти Ф., Райан А. (2009) Теоретико-информационный учебник по сложности, самоорганизации и возникновению. Сложность 15: 11–28.
- 7. Шустер Х (2002) Сложные адаптивные системы. Скатор Верлаг.
- 8. Соломонов Р. (1960) Предварительный отчет по общей теории индуктивного вывода. Технический отчет V-131, Zator Co., Кембридж, Массачусетс.
- 9. Вольфрам С. (1983) Статистическая механика клеточных автоматов. Phys Rev E 55: 601–644.
- 10. Бадии Р., Полити А. (1997) Сложность: иерархические структуры и масштабирование в физике. Издательство Кембриджского университета, Кембридж.
- 11. Беннет С. (1988) Логическая глубина и физическая сложность. Херкен Р., редактор книги «Универсальная машина Тьюринга — обзор за полвека», Oxford University Press. стр. 227–257.
- 12.Кратчфилд Дж. П., Янг К. (1989) Определение статистической сложности. Phys Rev Lett 63: 105–108.
- 13. Эммерт-Штрейб Ф. (2010) Исследовательский анализ пространственно-временных паттернов клеточных автоматов с помощью групповой сжимаемости. Physical Review E 81: 026103.
- 14. Эммерт-Штрейб Ф. (2010) Статистическая сложность: сочетание колмогоровской сложности с ансамблевым подходом. ПЛОС ОДИН 5: e12256.
- 15. Гелл-Манн М., Ллойд С. (1998) Информационные меры, эффективная сложность и общая информация.Сложность 2: 44–52.
- 16. Грассбергер П. (1986) На пути к количественной теории самогенерируемой сложности. Int J Theor Phys 25: 907–938.
- 17. Ллойд С., Пейджелс Х. (1988) Сложность как термодинамическая глубина. Анналы физики 188: 186–213.
- 18. Зурек В., редактор. (1990) Сложность, энтропия и физика информации. Аддисон-Уэсли, Редвуд-Сити.
- 19. Грассбергер П. (1989) Проблемы количественной оценки самогенерируемой сложности.Helvetica Physica Acta 62: 489–511.
- 20. Ли М., Витани П. (1997) Введение в колмогоровскую сложность и ее приложения. Спрингер.
- 21. Кратчфилд Дж., Паккард Н. (1983) Символическая динамика шумного хаоса. Физика D 7: 201–223.
- 22. Биалек В., Неменман И., Тишби Н. (2001) Предсказуемость, сложность и обучение. Нейронные вычисления 13: 2409–2463.
- 23. Бончев Д. (1983) Теоретико-информационные показатели для характеристики химических структур.Research Studies Press, Чичестер.
- 24. Бончев Д., Рувре Д.Х. (2005) Сложность в химии, биологии и экологии. Математическая и вычислительная химия. Спрингер. Нью-Йорк, штат Нью-Йорк, США.
- 25. Янежич Д., Милежевич А., Николич С., Тринайстич Н. (2009) Топологическая сложность молекул. Мейерс Р., редактор Энциклопедии сложности и системных наук, Springer, том 5, стр. 9210–9224.
- 26. Берц С.Х. (1983) О сложности графов и молекул.Bull Math Biol 45: 849–855.
- 27. Бончев Д., Поланский О.Е. (1987) О топологической сложности химических систем. Кинг Р.Б., Рувре Д.Х., редакторы журнала «Теория графов и топология», Elsevier. стр. 125–158. Амстердам, Нидерланды.
- 28. Ким Дж., Вильгельм Т. (2008) Что такое сложный граф? Физика А 387: 2637–2652.
- 29. Dancoff SM, Quastler H (1953) Информационное содержание и частота ошибок живых существ. Квастлер Х., редактор журнала «Очерки использования теории информации в биологии», издательство University of Illinois Press.стр. 263–274.
- 30. Linshitz H (1953) Информационное содержание элемента батареи. Квастлер Х., редактор журнала «Очерки использования теории информации в биологии», издательство University of Illinois Press. Урбана, Иллинойс, США.
- 31. Моровиц Х. (1953) Некоторые соображения порядка-беспорядка в живых системах. Bull Math Biophys 17: 81–86.
- 32. Миноли Д. (1975) Сложность комбинаторного графа. Atti Accad Naz Lincei, VIII Ser, Rend, Cl Sci Fis Mat Nat 59: 651–661.
- 33. Бончев Д. (2003) Сложность в химии. Введение и основы. Тейлор и Фрэнсис. Бока-Ратон, Флорида, США.
- 34. Константин Г. (1990)Сложность графа и матрица Лапласа в блочных экспериментах. Линейная и полилинейная алгебра 28: 49–56.
- 35. Юкна С (2006) О сложности графа. Расческа Probab Comput 15: 855–876.
- 36. Ли М., Витани П. (1997) Введение в колмогоровскую сложность и ее приложения.Спрингер.
- 37. Бончев Д. (1995) Информация Колмогорова, энтропия Шеннона и топологическая сложность молекул. Булг Хим Коммун 28: 567–582.
- 38. Демер М., Мовшовиц А. (2011) История мер энтропии графа. Информатика 1: 57–78.
- 39. Демер М. (2008) Обработка информации в сложных сетях: графовая энтропия и информационные функционалы. Appl Math Comput 201: 82–94.
- 40. Скоробогатов В.А., Добрынин А.А. (1988) Метрический анализ графов.Commun Math Comp Chem 23: 105–155.
- 41. Диудеа М.В., Гутман И., Янчи Л. (2001) Молекулярная топология. Издательство Нова. Нью-Йорк, штат Нью-Йорк, США.
- 42. Тодескини Р., Консонни В., Маннхольд Р. (2002) Справочник по молекулярным дескрипторам. Вайнхайм: Wiley-VCH.
- 43. Адами С. (2002) Что такое сложность? Биоэссе 24: 1085–1094.
- 44. Лэнгтон С. (1990) Вычисления на границе хоаса: фазовые переходы и возникающие вычисления.Физика Д 42: 12–37.
- 45. Рибейро А.С., Кауфман С.А., Ллойд-Прайс Дж., Самуэльссон Б., Соколар Дж.Е.С. (2008) Взаимная информация в случайных логических моделях регуляторных сетей. Phys Rev E 77: 011901.
- 46. Ньюман М. (2010) Сети: введение. Оксфорд: Издательство Оксфордского университета.
- 47. Балабан А. Т. (1982) Высоко различающий топологический индекс, основанный на расстоянии. ChemPhysLett 89: 399–404.
- 48. Бончев Д., Тринайстич Н. (1977) Теория информации, матрица расстояний и молекулярное разветвление.J Chem Phys 67: 4517–4533.
- 49. Латора В., Марчиори М. (2001) Эффективное поведение сетей малого мира. Phys Rev Lett 87: 198701.
- 50. Латора В., Маркиори М. (2003) Экономическое поведение маленького мира во взвешенных сетях. Европейский физический журнал B Condensed Matter 32: 249–263.
- 51. Гутман I (1991) Многочлены в теории графов. Бончев Д., Рувре Д. Х., редакторы, Химическая теория графов. Введение и основы, Abacus Press.стр. 133–176. Нью-Йорк, штат Нью-Йорк, США.
- 52. Демер М., Эммерт-Страйб Ф., Цой Ю., Вармуза К. (2011) Количественная оценка структурной сложности графов: информационные меры в математической химии. Путц М., редактор, Квантовые границы атомов и молекул, Nova Publishing. стр. 479–498.
- 53. Гутман И., Чжоу Б. (2006) Энергия Лапласа графа. Линейная алгебра и ее приложения 414: 29–37.
- 54. Claussen JC (2007) Характеристика сетей недиагональной сложностью.Физика А 365–373: 321–354.
- 55. Рэндич М. (1975) О характеристике молекулярного ветвления. J Amer Chem Soc 97: 6609–6615.
- 56. Мовшовиц А. (1968) Энтропия и сложность графов I: Индекс относительной сложности графа. Bull Math Biophys 30: 175–204.
- 57. Wiener H (1947) Структурное определение точек кипения парафинов. Журнал Американского химического общества 69: 17–20.
- 58. Рашевский Н. (1955) Жизнь, теория информации и топология.Bull Math Biophys 17: 229–235.
- 59. Trucco E (1956) Заметка об информационном содержании графиков. Bull Math Biol 18: 129–135.
- 60. Мовшовиц А. (1968) Энтропия и сложность графов II: информационное содержание орграфов и бесконечных графов. Bull Math Biophys 30: 225–240.
- 61. Мовшовиц А. (1968) Энтропия и сложность графов III: Графы с заданным информационным содержанием. Bull Math Biophys 30: 387–414.
- 62. Кормен Т.Х., Лейзерсон К.Э., Ривест Р.Л. (1990) Введение в алгоритмы. Массачусетский технологический институт Пресс.
- 63. Дейкстра Э. (1959) Заметка о двух проблемах, связанных с графами. Нумерическая математика 1: 269–271.
- 64. Балабан А.Т., Балабан Т.С. (1991) Новые инварианты вершин и топологические индексы химических графов на основе информации о расстояниях. J Math Chem 8: 383–397.
- 65. Бакли Ф., Харари Ф. (1990) Расстояние в графиках.Издательство Аддисон Уэсли.
- 66. Li X, Gutman I (2006) Математические аспекты дескрипторов молекулярной структуры типа Рэндича. Монографии по математической химии. Университет Крагуеваца и Факультет естественных наук Крагуеваца.
- 67. Демер М. , Мюллер Л., Грабер А. (2010) Новые молекулярные дескрипторы на основе полиномов с низкой степенью вырождения. PLoS ONE 5:
- 68. Гэри М.Р., Джонсон Д.С. (1979) Компьютеры и неразрешимость: Руководство по теории NPCompleteness.Серия книг по математическим наукам. WH Freeman.
- 69. Мовшовиц А., Мицу В. (2009) Энтропия, орбиты и спектры графов. Демер М., Эммерт-Страйб Ф., редакторы, Анализ сложных сетей: от биологии к лингвистике, Wiley-VCH. стр. 1–22.
- 70. Девильерс Дж., Балабан А.Т. (1999) Топологические индексы и связанные дескрипторы в QSAR и QSPR. Издательство Гордон и Брич Сайенс. Амстердам, Нидерланды.
- 71. Саган Х. (1989) Граничные задачи и задачи на собственные значения в математической физике.Дуврские публикации.
- 72. Pons P, LatapyM (2005)Вычислительные сообщества в больших сетях с использованием случайных блужданий. Yolum p, Güngör T, Gürgen F, Özturan C, редакторы, Computer and Information Sciences — ISCIS 2005, Springer Berlin/Heidelberg, том 3733 Lecture Notes in Computer Science. стр. 284–293.
- 73. Ван Донген С. (2000) Кластеризация графов с помощью моделирования потока. Кандидат наук. диссертация, Центры математики и информатики (CWI), Утрехтский университет.
- 74. Зив Э., Миддендорф М., Виггинс К.Х. (2005)Теоретико-информационный подход к модульности сети. Phys Rev E 71: 046117.
- 75. Чанг ФРК (1997) Теория спектральных графов. Американское математическое общество.
- 76. Мило Р., Шен-Орр С., Ицковиц С., Каштан Н., Чкловский Д. и соавт. (2002) Сетевые мотивы: простые строительные блоки сложных сетей. Наука 298: 824–827.
- 77. Эрдеш П., Реньи А. (1959) О случайных графах.I. Математические публикации 6: 290–297.
- 78. Гилберт Э.Н. (1959) Случайные графы. Анналы математической статистики 20: 1141–1144.
- 79. Альберт Р., Барабаси А. (2002) Статистическая механика сложных сетей. Rev of Modern Physics 74: 47.
- 80. Барабаси А.Л., Альберт Р. (1999)Появление масштабирования в случайных сетях. Наука 206: 509–512.
- 81. Феллер В. (1968) Введение в теорию вероятностей и ее приложения.1. Джон Уайли и сыновья.
- 82. Уоттс Д., Строгац С. (1998) Коллективная динамика сетей «маленького мира». Природа 393: 440–442.
- 83. Леман Э., Казелла Г. (1999) Теория точечной оценки. Нью-Йорк: Спрингер.
- 84. NewmanMEJ (2001) Структура сетей научного сотрудничества. Труды Национальной академии наук Соединенных Штатов Америки 98: 404–409.
- 85. Newman MEJ (2006) Нахождение структуры сообщества в сетях с использованием собственных векторов матриц.Phys Rev E 74: 036104.
- 86. Xenarios I, Rice DW, Salwinski L, Baron MK, Marcotte EM, et al. (2000) DIP: база данных взаимодействующих белков. Nucl Acids Res 28: 289–291.
- 87. Ceccatto HA, Huberman BA (1988) Сложность иерархических систем. Physica Scripta 37: 145.
- 88. Равас Э., Сомера А.Л., Монгру Д.А., Олтвай З.Н., Барабаси А.Л. (2002)Иерархическая организация модульности в метаболических сетях. Наука 297: 1551–1555.
- 89. Эммерт-Штрейб Ф. (2007)Синдром хронической усталости: сравнительный анализ путей. Журнал вычислительной биологии 14: 961–972.
- 90. Эммерт-Страйб Ф., Глазко Г. (2011)Анализ путей экспрессии данных: расшифровка функциональных строительных блоков сложных заболеваний. Вычислительная биология PLoS 7: e1002053.
- 91. Шадт Э. (2009)Молекулярные сети как датчики и движущие силы распространенных заболеваний человека. Природа 461: 218–223.
- 92. Богинский В., Бутенко С., Пардалос П. (2005) Статистический анализ финансовых сетей. Вычислительная статистика и анализ данных 48: 431–443.
- 93. Эммерт-Страйб Ф., Демер М. (2010) Выявление важнейших финансовых сетей индекса Доу-Джонса: на пути к сетевому индексу. Сложность 16: 24–33.
- 94. Эммерт-Страйб Ф., Демер М. (2010) Влияние шкалы времени на построение финансовых сетей. ПЛОС ОДИН 5: e12884.
- 95.Кайзер М., Хильгетаг К.С., Кёттер Р. (2010)Иерархия и динамика нейронных сетей. Границы нейроинформатики 4:
- 96. Спорнс О (2011) Сети мозга. Кембридж, Массачусетс: MIT Press.
- 97. Основная группа разработчиков R (2008 г.) R: язык и среда для статистических вычислений. R Foundation for Statistical Computing, Вена, Австрия. ISBN 3-1-07-0.
- 98. Мюллер Л.А., Куглер К.Г., Дандер А., Грабер А., Демер М. (2010) QuACN — пакет R для количественного анализа сложных биологических сетей.Биоинформатика.
Произошла ошибка при настройке пользовательского файла cookie
Произошла ошибка при настройке пользовательского файла cookieЭтот сайт использует файлы cookie для повышения производительности. Если ваш браузер не принимает файлы cookie, вы не можете просматривать этот сайт.
Настройка браузера на прием файлов cookie
Существует множество причин, по которым файл cookie не может быть установлен правильно. Ниже приведены наиболее распространенные причины:
- В вашем браузере отключены файлы cookie.Вам необходимо сбросить настройки браузера, чтобы принять файлы cookie, или спросить вас, хотите ли вы принимать файлы cookie.
- Ваш браузер спрашивает, хотите ли вы принимать файлы cookie, и вы отказались. Чтобы принять файлы cookie с этого сайта, нажмите кнопку «Назад» и примите файл cookie.
- Ваш браузер не поддерживает файлы cookie. Попробуйте другой браузер, если вы подозреваете это.
- Дата на вашем компьютере в прошлом. Если часы вашего компьютера показывают дату до 1 января 1970 г., браузер автоматически забудет файл cookie.Чтобы это исправить, установите правильное время и дату на своем компьютере.
- Вы установили приложение, которое отслеживает или блокирует установку файлов cookie. Вы должны отключить приложение при входе в систему или проконсультироваться с системным администратором.
Почему этому сайту требуются файлы cookie?
Этот сайт использует файлы cookie для повышения производительности, запоминая, что вы вошли в систему, когда переходите со страницы на страницу.Предоставить доступ без файлов cookie потребует от сайта создания нового сеанса для каждой посещаемой вами страницы, что замедляет работу системы до неприемлемого уровня.
Что сохраняется в файле cookie?
Этот сайт не хранит ничего, кроме автоматически сгенерированного идентификатора сеанса в файле cookie; никакая другая информация не фиксируется.
Как правило, в файле cookie может храниться только информация, которую вы предоставляете, или выбор, который вы делаете при посещении веб-сайта. Например, сайт не может определить ваше имя электронной почты, если вы не решите ввести его. Разрешение веб-сайту создавать файлы cookie не дает этому или любому другому сайту доступ к остальной части вашего компьютера, и только сайт, создавший файл cookie, может его прочитать.
Измерение сложностисетей с помощью Wolfram Language?
Мне очень жаль, что я присоединяюсь к обсуждению так поздно. Я думал, что получу уведомление, если меня упомянули в каком-то посте, или я, возможно, проглядел это.
Да! Я провел много исследований по сложности графов, и я думаю, что могу с уверенностью сказать, что у меня есть преимущество в этом предмете, поскольку я думаю, что придумал характеристики сложности графов и сетей, которые достаточно надежны, в то время как я открыл способы в какой граф и сеть не могут быть охарактеризованы, например с энтропией. В этой статье мы покажем, как энтропию можно легко обмануть, или нужно сделать произвольный выбор интересующей функции, и в этом случае вы можете заменить свою «функцию сложности» (энтропию) просто функцией выбранной функции (e . г. плотность ребер, нормальность последовательности степеней и т. д.).
Низкая алгоритмическая сложность Графики, обманывающие энтропию Уровень энтропии! В самом деле, Compress, так же как LZW (и, следовательно, gzip, png и т. д.), являются алгоритмами сжатия, которые ищут статистическое повторение и, таким образом, являются не чем иным, как оценкой скорости энтропии вплоть до длины скользящего окна алгоритма сжатия (доказано, что LZW является «универсальным», потому что длина окна является функцией работающей памяти компьютера, но, очевидно, она конечна, но даже если «универсальное» в этом смысле, оно не является «универсальным» в алгоритмическом смысле Тьюринга).
Заметьте также, что одна из основных проблем с большинством (если не со всеми, как я подозреваю) другими мерами заключается в том, что они либо основаны на линейных структурах, таких как последовательность степеней, либо каким-то образом линеаризуют сеть (даже в том, что касается выравнивания их матриц смежности). ), в то время как некоторые другие не устойчивы к изменению описания сети или предоставляют разные значения для изоморфных графов, поэтому возникает множество проблем.
Итак, какие у нас есть варианты? Единственный вариант — аппроксимировать таким образом алгоритмическую сложность графа (поскольку его теорема инвариантности гарантирует надежность), используя некоторые из представленных мной методов, которые действительно связаны с алгоритмической сложностью за пределами энтропии Шеннона, это с помощью алгоритмической вероятности.Обратите внимание, что предложение о сложности графа, которое мы ввели, является собственной мерой размерности графа (например, размерность 2 при рассмотрении его матрицы смежности) и, таким образом, не линеаризует искусственно граф, и мы показали как теоретически, так и численно, что мера является надежным и возвращает ожидаемую сложность как для помеченных, так и для немаркированных графов. Документы, показывающие, как и дающие технические подробности, а иногда и некоторый код или данные, чтобы сделать это самостоятельно:
Методы теории информации и алгоритмической сложности для сетевой биологии (H. Zenil, N.A. Kiani и J. Tegnér) Семинары по клеточной биологии и биологии развития, том. 51, стр. 32-43, 2016. Доступно здесь.
Двумерная сложность Колмогорова и проверка метода теоремы кодирования с помощью сжимаемости (Х. Зенил, Ф. Солер-Тоскано, Ж.-П. Делахайе и Н. Гаври) Информатика PeerJ, 1: e23, 2015 г. Доступно здесь.
и
Корреляция размера группы автоморфизмов и топологических свойств с оценками сложности графов и сложных сетей размера программы (H.Зенил, Ф. Солер-Тоскано, К. Дингл и А. Луис) Physica A: Статистическая механика и ее приложения, том. 404, стр. 341–358, 2014. Бумага доступна здесь. Препринт доступен здесь.
Наконец, чтобы объяснить все это, я создал 2 видео, доступных здесь. И, в частности, о сложности графа здесь.
Некоторый WL-код и даже онлайн-калькулятор сложности доступны здесь.
Извините за поздний ответ @VitaliyKaurov!
Использование теории графов для анализа биологических сетей | Добыча биоданных
Пеллегрини Маттео, Хейнор Дэвид, Джонсон Дж. М.: Сети взаимодействия белков. Эксперт Rev Proteomics. 2004, 1 (2):
Vikis HG, Guan KL: Анализы на основе слияния глутатион-S-трансферазы для изучения белок-белковых взаимодействий. Методы Мол Биол. 2004, 261: 175-186.
КАС пабмед Google Scholar
Puig O, Caspary F, Rigaut G, Rutz B, Bouveret E, Bragado-Nilsson E, Wilm M, Seraphin B: Метод тандемной аффинной очистки (TAP): общая процедура очистки белковых комплексов.Методы. 2001, 24 (3): 218-229.
КАС пабмед Google Scholar
Ито Т., Тиба Т., Одзава Р., Йошида М., Хаттори М., Сакаки Ю.: комплексный двухгибридный анализ для изучения интерактома дрожжевого белка. Proc Natl Acad Sci USA. 2001, 98 (8): 4569-4574.
КАС пабмед ПабМед Центральный Google Scholar
Gavin AC, Bosche M, Krause R, Grandi P, Marzioch M, Bauer A, Schultz J, Rick JM, Michon AM, Cruciat CM: Функциональная организация дрожжевого протеома путем систематического анализа белковых комплексов.Природа. 2002, 415 (6868): 141-147.
КАС пабмед Google Scholar
Stoll D, Templin MF, Bachmann J, Joos TO: Белковые микроматрицы: приложения и будущие задачи. Curr Opin Drug Discov Devel. 2005, 8 (2): 239-252.
КАС пабмед Google Scholar
Willats WG: Фаговый дисплей: практические аспекты и перспективы. Завод Мол Биол. 2002, 50 (6): 837-854.
КАС пабмед Google Scholar
Tong AH, Lesage G, Bader GD, Ding H, Xu H, Xin X, Young J, Berriz GF, Brost RL, Chang M: Глобальное картирование сети генетического взаимодействия дрожжей. Наука. 2004, 303 (5659): 808-813.
КАС пабмед Google Scholar
Krogan NJ, Cagney G, Yu H, Zhong G, Guo X, Ignatchenko A, Li J, Pu S, Datta N, Tikuisis AP: Глобальный ландшафт белковых комплексов в дрожжах Saccharomyces cerevisiae.Природа. 2006, 440 (7084): 637-643.
КАС пабмед Google Scholar
Xenarios I, Rice DW, Salwinski L, Baron MK, Marcotte EM, Eisenberg D: DIP: база данных взаимодействующих белков. Нуклеиновые Кислоты Res. 2000, 28 (1): 289-291.
КАС пабмед ПабМед Центральный Google Scholar
Mewes HW, Frishman D, Mayer KF, Munsterkotter M, Noubibou O, Pagel P, Rattei T, Oesterheld M, Ruepp A, Stumpflen V: MIPS: анализ и аннотация белков из целых геномов в 2005 г.Нуклеиновые Кислоты Res. 2006, Д169-172. 34 База данных
Gavin AC, Aloy P, Grandi P, Krause R, Boesche M, Marzioch M, Rau C, Jensen LJ, Bastuck S, Dumpelfeld B: Исследование протеома выявило модульность механизма дрожжевой клетки. Природа. 2006, 440 (7084): 631-636.
КАС пабмед Google Scholar
Hodges PE, McKee AH, Davis BP, Payne WE, Garrels JI: База данных дрожжевого протеома (YPD): модель для организации и представления полногеномных функциональных данных.Нуклеиновые Кислоты Res. 1999, 27 (1): 69-73.
КАС пабмед ПабМед Центральный Google Scholar
Mewes HW, Amid C, Arnold R, Frishman D, Guldener U, Mannhaupt G, Munsterkotter M, Pagel P, Strack N, Stumpflen V: MIPS: анализ и аннотация белков из целых геномов. Нуклеиновые Кислоты Res. 2004, Д41-44. 32 База данных
Zanzoni A, Montecchi-Palazzi L, Quondam M, Ausiello G, Helmer-Citterich M, Cesareni G: MINT: база данных молекулярного взаимодействия.ФЭБС лат. 2002, 513 (1): 135-140.
КАС пабмед Google Scholar
Керриен С. , Алам-Фарук Й., Аранда Б., Банкарз И., Бридж А., Дероу С., Диммер Э., Фейерманн М., Фридрихсен А., Хантли Р.: IntAct — ресурс с открытым исходным кодом для данных о молекулярном взаимодействии. Нуклеиновые Кислоты Res. 2007, Д561-565. 35 База данных
Бадер Г.Д., Дональдсон И., Уолтинг С., Уэллетт Б.Ф., Поусон Т., Хог К.В.: BIND — База данных сети биомолекулярного взаимодействия.Нуклеиновые Кислоты Res. 2001, 29 (1): 242-245.
КАС пабмед ПабМед Центральный Google Scholar
Старк С., Брайткройц Б.Дж., Регули Т., Бушер Л., Брайткройц А., Тайерс М.: BioGRID: общий репозиторий для наборов данных взаимодействия. Нуклеиновые Кислоты Res. 2006, Д535-539. 34 База данных
Кешава Прасад Т.С., Гоэл Р., Кандасами К., Киртикумар С., Кумар С., Мативанан С., Теликичерла Д., Раджу Р., Шафрин Б., Венугопал А. Справочная база данных белков человека — обновление 2009 года.Нуклеиновые Кислоты Res. 2009, Д767-772. 37 База данных
Хан К., Парк Б., Ким Х., Хонг Дж., Парк Дж.: HPID: база данных взаимодействия белков человека. Биоинформатика. 2004, 20 (15): 2466-2470.
КАС пабмед Google Scholar
Yu J, Pacifico S, Liu G, Finley RL: DroID: база данных взаимодействий дрозофилы, всеобъемлющий ресурс для аннотированных взаимодействий генов и белков. Геномика BMC. 2008, 9: 461.
ПабМед ПабМед Центральный Google Scholar
Kuhn Michael, Szklarczyk Damian, Franceschini Andrea, Campillos Monica, von Mering Christian, Lars Juhl Jensen AB, Bork P: STITCH 2: база данных сети взаимодействия для малых молекул и белков. Нуклеиновые Кислоты Res. 2010, Д552-Д556. 38
Jensen LJ, Kuhn M, Stark M, Chaffron S, Creevey C, Muller J, Doerks T, Julien P, Roth A, Simonovic M: STRING 8 — глобальный взгляд на белки и их функциональные взаимодействия в 630 организмах. Нуклеиновые Кислоты Res. 2009, Д412-416. 37 База данных
Pea Carninci: ландшафт транскрипции генома млекопитающих. Наука. 2005, 309: 1559-1563.
Google Scholar
Ри Линдинг: NetworkKIN: ресурс для изучения клеточных сетей фосфорилирования. Нуклеидные Кислоты Res. 2008, 36: Д695-Д699.
Google Scholar
Lee TI, Rinaldi NJ, Robert F, Odom DT, Bar-Joseph Z, Gerber GK, Hannett NM, Harbison CT, Thompson CM, Simon I: Регуляторные сети транскрипции в Saccharomyces cerevisiae.Наука. 2002, 298 (5594): 799-804.
КАС пабмед Google Scholar
Санделин А., Алкема В., Энгстрем П., Вассерман В.В., Ленхард Б.: JASPAR: открытая база данных профилей связывания эукариотических факторов транскрипции. Нуклеиновые Кислоты Res. 2004, 32: Д91-94.
КАС пабмед ПабМед Центральный Google Scholar
Wingender E, Dietze P, Karas H, Knuppel R: TRANSFAC: база данных факторов транскрипции и их сайтов связывания ДНК.Нуклеиновые Кислоты Res. 1996, 24 (1): 238-241.
КАС пабмед ПабМед Центральный Google Scholar
Matys V, Fricke E, Geffers R, Gossling E, Haubrock M, Hehl R, Hornischer K, Karas D, Kel AE, Kel-Margoulis OV: TRANSFAC: регуляция транскрипции, от паттернов к профилям. Нуклеиновые Кислоты Res. 2003, 31 (1): 374-378.
КАС пабмед ПабМед Центральный Google Scholar
Лефевр С., Лим В.К., Бассо К., Далла Фавера Р., Калифано А. Контекстно-зависимая сеть взаимодействий белок-ДНК и белок-белок выявляет новые регуляторные мотивы в В-клетках человека. Конспекты лекций по биоинформатике (LNCS). 2007, 4532: 42-56.
Google Scholar
Diella FCS, Gemünd C, Linding R, Via A, Kuster B, Sicheritz-Pontén T, Blom N, Gibson TJ: Phospho. ELM: база данных экспериментально подтвержденных сайтов фосфорилирования в эукариотических белках.Биоинформатика BMC. 2004, 5:
Google Scholar
Miller ML: Атлас линейных мотивов для передачи сигналов, зависящих от фосфорилирования. Научный сигнал. 2008, 1 (35):
Gnad F, Ren S, Cox J, Olsen JV, Macek B, Oroshi M, Mann M: PHOSIDA (база данных сайтов фосфорилирования): управление, структурное и эволюционное исследование и прогнозирование фосфитов. Геном биол. 2007, 8 (11):
Холоденко Б.Н., Хэнкок Дж.Ф., Кох В.: Сигнальный балет в пространстве и времени.Молекулярно-клеточная биология Nature Rev. 2010, 11: 414-426.
КАС Google Scholar
Ulrich LE, Z IB: MiST: база данных передачи микробных сигналов. Нуклеиновые Кислоты Res. 2007, 35: Д386-390.
КАС пабмед Google Scholar
Крулл М., Восс Н., Чой С., Пистор С., Потапов А., Вингендер Э.: TRANSPATH: интегрированная база данных по преобразованию сигналов и инструмент для анализа массивов.Нуклеиновые Кислоты Res. 2003, 31 (1): 97-100.
КАС пабмед ПабМед Центральный Google Scholar
Чон Х., Томбор Б., Альберт Р., Олтвай З.Н., А.Л.: Крупномасштабная организация метаболических сетей. Природа. 2000, 407: 651-654.
КАС пабмед Google Scholar
Feist AM, Herrgård MJ, Thiele I, Reed JL, Palsson B: Реконструкция биохимических сетей микроорганизмов.Nature Rev Микробиология. 2009, 7: 129-143.
КАС Google Scholar
Ма Х, Мазеин А, Сельков А, Сельков Е, Демин О, Горянин И: Реконструкция Эдинбургской метаболической сети человека и ее функциональный анализ. Мол Сист Биол. 2007, 3 (135):
Канехиса М., Гото С., Фурумичи М., Танабэ М., Хиракава М.: KEGG для представления и анализа молекулярных сетей, связанных с болезнями и лекарствами. Нуклеиновые Кислоты Res.Д355-360. 38 База данных
Кеселер И.М., Бонавидес-Мартинес С., Кольядо-Видес Дж., Гама-Кастро С., Гунсалус Р.П., Джонсон Д.А., Крумменакер М., Нолан Л.М., Палей С., Полсен ИТ: EcoCyc: комплексный обзор Биология кишечной палочки. Нуклеиновые Кислоты Res. 2009, Д464-470. 37 База данных
Karp PD, Ouzounis CA, Moore-Kochlacs C, Goldovsky L, Kaipa P, Ahren D, Tsoka S, Darzentas N, Kunin V, Lopez-Bigas N: Расширение коллекции BioCyc path/ базы данных геномов до 160 геномов.Нуклеиновые Кислоты Res. 2005, 33 (19): 6083-6089.
КАС пабмед ПабМед Центральный Google Scholar
Whitaker JW, Letunic I, McConkey GA, Westhead DR: metaTIGER: ресурс метаболической эволюции. Нуклеиновые Кислоты Res. 2009, Д531-538. 37 База данных
Schilling CH, Letscher D, Palsson BO: Теория системного определения метаболических путей и их использование в интерпретации метаболической функции с точки зрения путей.Дж Теор Биол. 2000, 203 (3): 229-248.
КАС пабмед Google Scholar
Schilling CH, Palsson BO: Оценка метаболических возможностей Haemophilus influenzae Rd посредством анализа путей в масштабе генома. Дж Теор Биол. 2000, 203 (3): 249-283.
КАС пабмед Google Scholar
Schilling CH, Schuster S, Palsson BO, Heinrich R: Анализ метаболических путей: основные концепции и научные приложения в постгеномную эпоху.Биотехнологическая прог. 1999, 15 (3): 296-303.
КАС пабмед Google Scholar
Шустер С., Фелл Д.А., Дандекар Т.: Общее определение метаболических путей, полезное для систематической организации и анализа сложных метаболических сетей. Нац биотехнолог. 2000, 18 (3): 326-332.
КАС пабмед Google Scholar
Шустер С., Дандекар Т., Фелл Д.А.: Обнаружение элементарных режимов потока в биохимических сетях: многообещающий инструмент для анализа путей и метаболической инженерии.Тенденции биотехнологии. 1999, 17 (2): 53-60.
КАС пабмед Google Scholar
Хука М., Финни А., Сауро Х.М., Болури Х., Дойл Дж.С., Китано Х., Аркин А.П., Борнштейн Б.Дж., Брей Д., Корниш-Боуден А.: Язык разметки системной биологии (SBML): среда для представление и обмен моделями биохимических сетей. Биоинформатика. 2003, 19 (4): 524-531.
КАС пабмед Google Scholar
Финни А., Хука М.: Язык разметки системной биологии: уровень 2 и выше. Труды биохимического общества. 2003, 31 (часть 6): 1472-1473.
КАС пабмед Google Scholar
Hermjakob H, Montecchi-Palazzi L, Bader G, Wojcik J, Salwinski L, Ceol A, Moore S, Orchard S, Sarkans U, von Mering C: Формат молекулярного взаимодействия HUPO PSI — стандарт сообщества для представление данных о взаимодействии белков. Нац биотехнолог.2004, 22 (2): 177-183.
КАС пабмед Google Scholar
Murray RP, S RH: Химическая разметка, XML и Всемирная паутина. 1. Основные принципы. Chem Inf Comput Sci. 1999, 39: 928-942.
Google Scholar
Murray-Rust P, Rzepa HS, Wright M: Разработка языка химической разметки (CML) как системы для обработки сложного химического содержимого. Новый J Chem.2001, 618-634.
Google Scholar
Рабочая группа BioPAX: язык обмена биологическими путями BioPAX. Документация версии 10. 2004
Google Scholar
Lloyd CM, Halstead MD, Nielsen PF: CellML: будущее, настоящее и прошлое. Прогресс в биофизике и молекулярной биологии. 2004, 85 (2-3): 433-450.
КАС пабмед Google Scholar
Лассила О., Свик Р.: Модель структуры описания ресурсов (RDF) и спецификация синтаксиса. Консорциум World Wide Web (W3C) MIT, INRIA. 1999
Google Scholar
Язык описания словаря RDF 1.0: Схема RDF. [http://www.w3.org/tr/2002/wd-rdf-schema-20020430/]
Кормен Т.Х., Лейзерсон К.Э., Ривест Рональд Л., Штейн К.: Введение в алгоритмы. 2002, Кембридж, Массачусетс 02142: MIT Press
Google Scholar
Хубер В., Кэри В.Дж., Лонг Л., Фалькон С., Джентльмен Р.: Графики в молекулярной биологии. Биоинформатика BMC. 2007, 8 (Приложение 6): S8.
ПабМед ПабМед Центральный Google Scholar
Lee HK, Hsu AK, Sajdak J, Qin J, Pavlidis P: Анализ коэкспрессии генов человека во многих наборах данных микрочипов. Геном Res. 2004, 14 (6): 1085-1094.
КАС пабмед ПабМед Центральный Google Scholar
Шульц Х.Дж., Джон М., Унгер А., Шуман Х.: Визуальный анализ двудольных биологических сетей. Семинар Eurographics по визуальным вычислениям для биомедицины. 2008
Google Scholar
Бургос Э., Сева Х., Эрнандес Л., Пераццо Р.П.Дж., Девото М., Медан Д.: Два класса двусторонних сетей: вложенные биологические и социальные системы. Phys Rev. 2008, 78:
Google Scholar
Пикард Ф., Миеле В., Додин Дж.-Дж., Коттре Л., Робин С.: Расшифровка структуры связности биологических сетей с использованием MixNet. Биоинформатика BMC. 2009, 10:
Google Scholar
Leclerc RD: Выживание самых редких: надежные генные сети экономны. Мол Сист Биол. 2008, 4: 213.
ПабМед ПабМед Центральный Google Scholar
Dijkstra EW: Заметка о двух проблемах, связанных с графами.Нумерическая математика. 1959, 1: 269-271.
Google Scholar
Floyd RW: Алгоритм 97. Связь ACM. 1962, 5-6: 345.
Google Scholar
Брон С., Кербош Дж. Алгоритм 457: поиск всех клик неориентированного графа. Коммунальный АКМ (АКМ). 1973, 16 (9): 575-577.
Google Scholar
Zhang H, Song X, Wang H, Zhang X: MIClique: Алгоритм идентификации подмножества генов с дифференциальной коэкспрессией по данным микрочипа.Журнал биомедицины и биотехнологии. 2009
Google Scholar
Вой Б.Х., Шарфф Дж.А., Перкинс А.Д., Сакстон А.М., Борат Б., Чеслер Э.Дж., Бранстеттер Л.К., Лэнгстон М.А.: Извлечение генных сетей для малых доз радиации с использованием теоретико-графовых алгоритмов. PLoS Comput Biol. 2006, 2 (7):
Manfield IW, Jen CH, Pinney JW, Michalopoulos I, Bradford JR, Gilmartin PM, Westhead DR: Arabidopsis Co-expression Tool (ACT): инструменты веб-сервера для микрочипов анализ экспрессии генов.Нуклеиновые Кислоты Res. 2006 г., W504-509. 34 Web Server
Gentleman RC, Carey VJ, Bates DM, Bolstad B, Dettling M, Dudoit S, Ellis B, Gautier L, Ge Y, Gentry J: Bioconductor: открытая разработка программного обеспечения для вычислительной биологии и биоинформатики. Биология генома. 2004, 5 (10): Р80.
ПабМед ПабМед Центральный Google Scholar
Ravasz E, Somera A, Mongru D, Oltvai Z, Barabási AL: Иерархическая организация модульности в метаболических сетях. Наука. 2002, 297: 1551-1555.
КАС пабмед Google Scholar
Barabási AL, Gulbahce N, Loscalzo J: Сетевая медицина: сетевой подход к заболеваниям человека. Природа Обзоры Генетика. 2011, 12: 56-68.
ПабМед ПабМед Центральный Google Scholar
Мило Р., Шен-Орр С., Ицковиц С., Каштан Н., Чкловский Д., Алон У. Сетевые мотивы: простые строительные блоки сложных сетей.Наука. 2002, 298 (5594): 824-827.
КАС пабмед Google Scholar
Шен-Орр С., Мило Р., Манган С., Алон У. Сетевые мотивы в сети регуляции транскрипции Escherichia coli. Нат Жене. 2002, 31: 64-68.
КАС пабмед Google Scholar
Ingram PJ, Stumpf MP, Stark J: Сетевые мотивы: структура не определяет функцию.Геномика BMC. 2006, 7: 108.
ПабМед ПабМед Центральный Google Scholar
Зотенко Э., Местре Дж., О’Лири Д.П., Пшитыцка Т.М.: Почему концентраторы в сети взаимодействия белков дрожжей имеют важное значение: повторное изучение связи между топологией сети и существенностью. PLoS Comput Biol. 2008, 4: 1-16.
Google Scholar
Леви С.Ф., С.М.Л.: Сетевые концентраторы буферизируют экологические изменения Saccharomyces cerevisiae.PLoS биол. 2008, 6 (11):
млн лет H-W, Z AP: Структура связности, гигантский сильный компонент и центральность метаболических сетей. Биоинформатика. 2003, 19 (11):
Мазурие А., Бончев Д., Швиковский Б., Бак Г.А.: Эволюция организации метаболической сети. БМС Сист Био. 2010, 4:
Google Scholar
da Silva MR, Ma H, Zeng AP: Центральность, пропускная способность сети и модульность как параметры для анализа структуры ядро-периферия в метаболических сетях.Труды IEEE. 2008, 96 (8): 1411-1420.
КАС Google Scholar
Ронг ZHL, X Lu, W L: Закрепление сложной сети с помощью стратегии центральности между. Схемы и системы Международный симпозиум IEEE. 2009, 1689-1692.
Google Scholar
Китсак М., Хавлин С., Пол Г., Риккабони М., Паммолли Ф., Стэнли Х.Е.: Центральность между фрактальными и нефрактальными безмасштабными модельными сетями и тесты на реальных сетях.Phys Rev E. 2007, 75:
Google Scholar
Джой М.П., Брок А., Ингбер Д.Э., Хуанг С.: Белки с высоким промежуточным положением в сети взаимодействия белков дрожжей. Дж. Биомед Биотехнолог. 2005, 2: 96-103.
Google Scholar
Паладугу С.Р., Чжао С., Рэй А., Равал А.: Добыча белковых сетей для синтетических генетических взаимодействий. Биоинформатика BMC. 2008, 9:
Google Scholar
Озгюр А., Ву Т., Эркан Г., Радев Д.Р.: Выявление ассоциаций между генами и болезнями с использованием централизации в изученной в литературе сети взаимодействия генов. Биоинформатика. 2008, 24 (13): i277-i285.
ПабМед ПабМед Центральный Google Scholar
Чавали С., Барренас Ф., Кандури К., Бенсон М.: Сетевые свойства генов болезней человека с плейотропными эффектами. БМС Сист Био. 2010, 4:
Google Scholar
Estrada E: Характеристика степени сворачивания белков. Биоинформатика. 2002, 18: 697-704.
КАС пабмед Google Scholar
Estrada E, Uriarte E: Последние достижения в области роли топологических индексов в исследованиях по открытию лекарств. Курр Мед Хим. 2001, 8: 1699-1714.
Google Scholar
Эстрада E: Обобщенные меры центральности на основе прогулок для сложных биологических сетей.Дж Теор Биол. 2010, 263 (4): 556-565.
ПабМед Google Scholar
Нисбах Ф., К. М.: Временные окна развития для пространственного роста создают многокластерные сети малого мира. Eur Phys J B. 2007, 58: 185-191.
КАС Google Scholar
Costa LdF, Kaiser M, Hilgetag CC: Прогнозирование связности корковых сетей приматов на основе топологических и пространственных свойств узлов.БМС Сист Био. 2007, 1:
Google Scholar
Jeong H, Mason SP, Barabasi AL, Oltvai ZN: Летальность и центральность в белковых сетях. Природа. 2001, 411 (6833): 41-42.
КАС пабмед Google Scholar
Хан М, К. А.: Сравнительная геномика центральности и эссенциальности в трех эукариотических сетях межбелковых взаимодействий. Мол Биол Эвол. 2005, 22: 803-806.
КАС пабмед Google Scholar
Кошюцки Д., С. Ф.: Сравнение центральностей для биологических сетей. Proc German Conf Bioinformatics (GCB’04). 2004 г., Р-53 ЛНИ:
Google Scholar
Юнкер Б.Х., Кошютцки Д., Шрайбер Ф.: Исследование центров биологической сети с помощью CentiBiN. Биоинформатика BMC. 2006, 7:
Google Scholar
Баур М., Бенкерт М., Брандес У., Корнельсен С., Гертлер М., Кёпф Б., Лернер Дж., Вагнер Д.: visone — Программное обеспечение для визуального анализа социальных сетей. Proc 9th Intl Intl Symp Graph Drawing (GD ’01), LNCS. 2002, 2265: 463-464.
Google Scholar
Батагель В., Мрвар А.: Паек — Программа для анализа больших сетей. Соединения. 1998, 21: 47-57.
Google Scholar
Hu Z, Mellor J, Wu J, Yamada T, Holloway D, DeLisi C: VisANT: визуальная структура интеграции данных для биологических сетей и модулей.Нуклеиновые Кислоты Res. 2005, 33: W352-W357.
КАС пабмед ПабМед Центральный Google Scholar
Альберт Р. Безмасштабные сети в клеточной биологии. Журнал клеточной науки. 2005, 118:
Google Scholar
Лима-Мендез Г., Ван Хелден Дж. Мощный степенной закон и другие мифы сетевой биологии. Мол Биосист. 2009, 5 (12): 1482-1493.
КАС пабмед Google Scholar
Newman MEJ: Ассортативное смешение в сетях. Phys Rev Lett. 2002, 89 (208701):
Newman MEJ: Шаблоны смешивания в сетях. Phys Rev. 2003, 67:
Google Scholar
Реднер С: Сети: поиск недостающих звеньев. Природа. 2008, 453: 47-48.
КАС пабмед Google Scholar
Эрдёш П., Р. А. О силе связности случайного графа.Acta Math Acad Sci Hungar. 1961, 12: 261-267.
Google Scholar
Watts DJ, S SH: Коллективная динамика сетей «маленького мира». Природа. 1998, 393: 440-442.
КАС пабмед Google Scholar
Barabási AL, AR: Возникновение масштабирования в случайных сетях. Наука. 1999, 286: 509-512.
ПабМед Google Scholar
Берг Дж., Лассиг М., Вагнер А.: Структура и эволюция сетей взаимодействия белков: статистическая модель динамики связей и дупликаций генов. БМС Эвол Биол. 2004, 4 (1): 51.
ПабМед ПабМед Центральный Google Scholar
Yamada T, B P: Эволюция биомолекулярных сетей — уроки метаболических и белковых взаимодействий. Молекулярно-клеточная биология Nature Rev. 2009, 10: 791-803.
КАС Google Scholar
Джейн А.К., Мурти М.Н., Флинн П.Дж.: Кластеризация данных: обзор. Вычислительные исследования ACM (CSUR). 1999, 31 (3): 264-323.
Google Scholar
Дуда Р.О., Харт П.Е., Аист Д.Г.: Классификация шаблонов, глава 10: Неконтролируемое обучение и кластеризация. Уайли, Нью-Йорк. 2001, 571.
Google Scholar
Saitou N, Nei M: Метод соединения соседей: новый метод реконструкции филогенетических деревьев.Мол Биол Эвол. 1987, 4 (4): 406-425.
КАС пабмед Google Scholar
Борат Б.Р., Чеслер Э.Дж., Лэнгстон М.А., Сакстон А.М., Вой Б.Х.: Сравнение методов пороговой селекции для матриц совместной экспрессии генов микрочипов. Примечания BMC Res. 2009, 2 (240):
Перкинс А.Д., Л.МА.: Пороговый отбор в сетях коэкспрессии генов с использованием методов теории спектральных графов. Биоинформатика BMC. 2009, 10:
Google Scholar
Quackenbush J: Вычислительная генетика: Вычислительный анализ данных микрочипов. Нат Рев Генетика. 2001, 2: 418-427.
КАС пабмед Google Scholar
Миллиган Гленн, Купер М.С.: Обзор методологии: Методы кластеризации. Прикладное психологическое измерение. 1987, 11 (4): 329-354.
Google Scholar
Sneath PHA, Sokal RR: Невзвешенный парно-групповой метод со средним арифметическим.Числовая таксономия. 1973, Сан-Франциско: Фримен, 230-234.
Google Scholar
Миченер К.Д., Сокаль Р.Р.: Количественный подход к проблеме классификации. Эволюция. 1957, 11 (2): 130-162.
Google Scholar
Gascuel O, Steel M: Обнаружено соединение с соседями. Мол Биол Эвол. 2006, 23 (11): 1997-2000.
КАС пабмед Google Scholar
Д’андрейд Р.: U-статистическая иерархическая кластеризация. Психометрика. 1978, 4: 58-67.
Google Scholar
Джонсон SC: Схемы иерархической кластеризации. Психометрика. 1967, 2: 241-254.
Google Scholar
Seo J, Shneiderman B: Интерактивное изучение результатов иерархической кластеризации. Компьютер. 2002, 35 (7): 80-86.
Google Scholar
Seo J, Gordish-Dressman H, Hoffman EP: Интерактивный инструмент анализа мощности для проверки и генерации гипотез микрочипов. Биоинформатика. 2006, 22 (7): 808-814.
КАС пабмед Google Scholar
Кумар С., Тамура К., Ней М.: MEGA3: интегрированное программное обеспечение для молекулярно-эволюционного генетического анализа и выравнивания последовательностей. Кратко Биоинформ. 2004, 5 (2): 150-163.
КАС пабмед Google Scholar
Тамура К., Дж. Д., Ней М., С. К.: MEGA4: программное обеспечение для молекулярно-эволюционного генетического анализа (MEGA), версия 4.0. Молекулярная биология и эволюция. 2007, 24: 1596-1599.
КАС пабмед Google Scholar
Кумар С., Тамура К., Якобсен И., Ней М.: MEGA2: программное обеспечение для анализа молекулярно-эволюционной генетики. Биоинформатика. 2001, 17 (12): 1244-1245.
КАС пабмед Google Scholar
Кумар С., Тамура К., Ней М.: MEGA: программное обеспечение для молекулярно-эволюционного генетического анализа для микрокомпьютеров. Вычислительное приложение Biosci. 1994, 10 (2): 189-191.
КАС пабмед Google Scholar
Саид А.И., Шаров В., Уайт Дж., Ли Дж., Лян В., Бхагабати Н., Брайстед Дж., Клапа М., Карриер Т., Тиагараджан М.: TM4: бесплатная система с открытым исходным кодом для управления данными микрочипов и анализ. БиоТехники. 2003, 34 (2): 374-378.
КАС пабмед Google Scholar
Павлопулос Г.А., Солдатос Т.Г., Барбоза-Сильва А., Шнайдер Р.: Справочное руководство по анализу и визуализации деревьев. Биоданные Мин. 2010, 3 (1): 1.
ПабМед ПабМед Центральный Google Scholar
Enright AJ, Van Dongen S, Ouzounis CA: Эффективный алгоритм для крупномасштабного обнаружения белковых семейств. Нуклеиновые Кислоты Res. 2002, 30 (7): 1575-1584.
КАС пабмед ПабМед Центральный Google Scholar
Moschopoulos CN, Pavlopoulos GA, Schneider R, Likothanassis SD, Kossida S: GIBA: инструмент кластеризации для обнаружения белковых комплексов. Биоинформатика BMC. 2009, 10 (Приложение 6): S11.
ПабМед ПабМед Центральный Google Scholar
Gao L, Sun PG, Song J: Алгоритмы кластеризации для обнаружения функциональных модулей в сетях взаимодействия белков. J Bioinform Comput Biol. 2009, 7 (1): 217-242.
КАС пабмед Google Scholar
Zhong W, Altun G, Harrison R, Tai PC, Pan Y: Улучшенный алгоритм кластеризации K-средних для изучения мотивов локальных белковых последовательностей, представляющих общее структурное свойство. IEEE Транс-нанобиология. 2005, 4 (3): 255-265.
ПабМед Google Scholar
ван Доген С.: Кластеризация графов с помощью моделирования потока. Кандидатская диссертация. 2000, Утрехтский университет
Google Scholar
Власблом Дж., Водак С.Дж.: Марковская кластеризация по сравнению с аффинным распространением для разделения графов взаимодействия белков. Биоинформатика BMC. 2009, 10: 99.
ПабМед ПабМед Центральный Google Scholar
Enright AJ, Van Dongen S, Ouzounis CA: Эффективный алгоритм для крупномасштабного обнаружения белковых семейств. Нуклеиновые Кислоты Res. 2002, 30 (7): 1575-1584.
КАС пабмед ПабМед Центральный Google Scholar
MacQueen B: Некоторые методы классификации и анализа многомерных наблюдений. Материалы 5-го симпозиума Беркли по математической статистике и вероятностям. 1967, Беркли, Калифорнийский университет Press, 1: 281-297.
Google Scholar
Lu Y, Lu S, Fotouhi F, Deng Y, Brown SJ: Инкрементный генетический алгоритм K-средних и его применение в анализе данных экспрессии генов. Биоинформатика BMC. 2004, 5: 172.
ПабМед ПабМед Центральный Google Scholar
Фрей Б.Дж., Дуек Д.: Кластеризация путем передачи сообщений между точками данных. Наука. 2007, 315 (5814): 972-976.
КАС пабмед Google Scholar
King AD, Przulj N, Jurisica I: Прогноз белковых комплексов с помощью кластеризации на основе затрат. Биоинформатика. 2004, 20 (17): 3013-3020.
КАС пабмед Google Scholar
Пакканаро А., Касбон Дж. А., Саки М. А.: Спектральная кластеризация белковых последовательностей. Нуклеиновые Кислоты Res. 2006, 34 (5): 1571-1580.
КАС пабмед ПабМед Центральный Google Scholar
Li X, Wu M, Kwoh CK, Ng SK: Вычислительные подходы для обнаружения белковых комплексов из сетей взаимодействия белков: обзор. Геномика BMC. 2010, 11 (Приложение 1): S3.
ПабМед ПабМед Центральный Google Scholar
Brohee S, van Helden J: Оценка алгоритмов кластеризации для сетей взаимодействия белок-белок. Биоинформатика BMC. 2006, 7: 488.
ПабМед. ПабМед Центральный Google Scholar
Павлопулос Г.А., Вегенер А.Л., Шнайдер Р.: Обзор инструментов визуализации для анализа биологических сетей. Биоданные Мин. 2008, 1: 12.
ПабМед ПабМед Центральный Google Scholar
Brohee S, Faust K, Lima-Mendez G, Sand O, Janky R, Vanderstocken G, Deville Y, van Helden J: NeAT: набор инструментов для анализа биологических сетей, кластеров, классов и путей. Нуклеиновые Кислоты Res. 2008 г., W444-451. 36 Веб-сервер
Павлопулос Г.А., Москопулос К.Н., Хупер С.Д., Шнайдер Р., Коссида С.: jClust: набор инструментов для кластеризации и визуализации. Биоинформатика. 2009, 25 (15): 1994–1996.
КАС пабмед ПабМед Центральный Google Scholar
Йошида Р., Хигучи Т., Имото С., Мияно С.: ArrayCluster: аналитический инструмент для кластеризации, визуализации данных и поиска модулей профилей экспрессии генов. Биоинформатика. 2006, 22: 1538-1539.
КАС пабмед Google Scholar
Хупер С.Д., Борк П.: Медуза: простой инструмент для анализа графа взаимодействия. Биоинформатика. 2005, 21 (24): 4432-4433.
КАС пабмед Google Scholar
Shannon P, Markiel A, Ozier O, Baliga NS, Wang JT, Ramage D, Amin N, Schwikowski B, Ideker T: Cytoscape: программная среда для интегрированных моделей сетей биомолекулярного взаимодействия. Геном Res. 2003, 13 (11): 2498-2504.
КАС пабмед ПабМед Центральный Google Scholar
Павлопулос Г.А., О’Донохью С.И., Сатагопам В.П., Солдатос Т.Г., Пафилис Э., Шнайдер Р.: Arena3D: визуализация биологических сетей в 3D.Системная биология BMC. 2008, 2: 104.
ПабМед ПабМед Центральный Google Scholar
Uetz P, Giot L, Cagney G, Mansfield TA, Judson RS, Knight JR, Lockshon D, Narayan V, Srinivasan M, Pochart P: всесторонний анализ белок-белковых взаимодействий в Saccharomyces cerevisiae. Природа. 2000, 403 (6770): 623-627.
КАС пабмед Google Scholar
Rain JC, Selig L, De Reuse H, Battaglia V, Reverdy C, Simon S, Lenzen G, Petel F, Wojcik J, Schachter V: Карта белок-белковых взаимодействий Helicobacter pylori. Природа. 2001, 409 (6817): 211-215.
КАС пабмед Google Scholar
Giot L, Bader JS, Brouwer C, Chaudhuri A, Kuang B, Li Y, Hao YL, Ooi CE, Godwin B, Vitols E: Карта взаимодействия белков Drosophila melanogaster. Наука. 2003, 302 (5651): 1727-1736.
КАС пабмед Google Scholar
Li S, Armstrong CM, Bertin N, Ge H, Milstein S, Boxem M, Vidalain PO, Han JD, Chesneau A, Hao T: Карта интерактомной сети многоклеточных C. elegans. Наука. 2004, 303 (5657): 540-543.
КАС пабмед ПабМед Центральный Google Scholar
фон Меринг С., Краузе Р., Снел Б., Корнелл М., Оливер С.Г., Филдс С., Борк П.: Сравнительная оценка крупномасштабных наборов данных о межбелковых взаимодействиях.Природа. 2002, 417 (6887): 399-403.
КАС пабмед Google Scholar
Раман К.: Построение и анализ сетей белок-белковых взаимодействий. Автом Эксп. 2010, 2 (1): 2.
ПабМед ПабМед Центральный Google Scholar
Salgado H, Santos-Zavaleta A, Gama-Castro S, Peralta-Gil M, Penaloza-Spinola MI, Martinez-Antonio A, Karp PD, Collado-Vides J: Обширная обновленная регуляторная сеть Escherichia coli К-12.Биоинформатика BMC. 2006, 7: 5.
ПабМед ПабМед Центральный Google Scholar
Сальгадо Х., Гама-Кастро С., Перальта-Хиль М., Диас-Передо Э., Санчес-Солано Ф., Сантос-Завалета А., Мартинес-Флорес И., Хименес-Хасинто В., Бонавидес-Мартинес С., Сегура -Салазар Дж.: RegulonDB (версия 5.0): регуляторная сеть транскрипции Escherichia coli K-12, организация оперонов и условия роста. Нуклеиновые Кислоты Res. 2006, Д394-397. 34 База данных
Лозада-Чавес И., Янга С.К., Кольядо-Видес Дж.: Бактериальные регуляторные сети чрезвычайно гибки в процессе эволюции. Нуклеиновые Кислоты Res. 2006, 34 (12): 3434-3445.
КАС пабмед ПабМед Центральный Google Scholar
Мадан Бабу М., Тейхманн С.А., Аравинд Л.: Эволюционная динамика прокариотических регуляторных сетей транскрипции. Дж Мол Биол. 2006, 358 (2): 614-633.
КАС пабмед Google Scholar
Снеппен Ким, Зокки Г.: Физика в молекулярной биологии. 2005, Джованни Зокки
Google Scholar
ван Нимвеген Э. Законы масштабирования функционального содержания геномов. Тенденции Жене. 2003, 19 (9): 479-484.
КАС пабмед Google Scholar
Бхалла США, Айенгар Р.: Возникающие свойства сетей биологических сигнальных путей. Наука. 1999, 283 (5400): 381-387.
КАС пабмед Google Scholar
Юнкер Бьорн, Шрайбер Ф.: Анализ биологических сетей. 2008
Google Scholar
Guelzim N, Bottani S, Bourgine P, Kepes F: Топологическая и причинно-следственная структура сети регуляции транскрипции дрожжей. Нат Жене. 2002, 31 (1): 60-63.
КАС пабмед Google Scholar
Ma H, Zeng AP: Реконструкция метаболических сетей по данным генома и анализ их глобальной структуры для различных организмов. Биоинформатика. 2003, 19 (2): 270-277.
КАС пабмед Google Scholar
Чон Х., Томбор Б., Альберт Р., Олтвай З.Н., Барабаси А.Л.: Крупномасштабная организация метаболических сетей. Природа. 2000, 407 (6804): 651-654.
КАС пабмед Google Scholar
Гагнер Дж., Джексон Д.Б., Касари Г.: Иерархический анализ зависимости в метаболических сетях. Биоинформатика. 2003, 19 (8): 1027-1034.
КАС пабмед Google Scholar
Холм П., Хасс М., Чон Х. Иерархии подсетей биохимических путей. Биоинформатика. 2003, 19 (4): 532-538.
КАС пабмед Google Scholar
Объяснение вычислительной сложности графовых нейронных сетей | by Franziska Lippoldt
В отличие от обычных сверточных нейронных сетей, стоимость сверток графа «нестабильна» — поскольку выбор представления графа и ребер соответствует сложности сверток графа — объяснение, почему.
Плотное и разреженное графическое представление: дорогое или дешевое?
Данные графика для входа GNN могут быть представлены двумя способами:
A) разреженный: как список узлов и список индексов ребер
B) плотный: как список узлов и матрица смежности
Для любого графа G с N вершинами длины F и M ребер разреженная версия будет работать с узлами размера N * F и списком индексов ребер размером 2 * M. Плотное представление, напротив, потребует матрицы смежности размер Н*Н.
Хотя в целом разреженное представление намного дешевле при использовании внутри графовой нейронной сети для прямого и обратного прохода, операции модификации ребра требуют поиска правильных пар ребро-узел и, возможно, корректировки общего размера списка, что приводит к изменениям в использовании оперативной памяти в сети. Другими словами, разреженные представления минимизируют использование памяти для захватов с фиксированными ребрами.
Несмотря на дороговизну, плотное представление имеет следующие преимущества: веса ребер естественным образом включаются в матрицу смежности, модификация ребер может быть выполнена плавным образом и интегрирована в сеть, поиск ребер и изменение значений ребер не меняются размер матрицы.Эти свойства имеют решающее значение для графовых нейронных сетей, которые полагаются на модификации границ сети.
Принимая во внимание приложения GNN, выбор между разреженным и плотным представлением можно сформулировать в виде двух вопросов:
- Есть ли преимущество в вычислительной сложности, т.е. какова связь между количеством узлов и количеством ребер на узел или на 2*M намного меньше, чем N*N
- Требует ли приложение дифференцируемых модификаций ребер
Хотя на первый вопрос можно сразу ответить после изучения графиков, второй вопрос зависит от структуры нейронной сети, поскольку а также сложность графа.На данный момент кажется, что большие графы (не говоря о примерах игрушек здесь) выигрывают от объединения и слоев нормализации/стабилизации между слоями сверток графа.
Ребра и сложность свертки
В то время как некоторые графы естественным образом возникают из данных благодаря четко определенным отношениям между узлами, например граф взаимодействия транзакций между учетными записями за последний месяц, некоторые более сложные постановки задач, особенно для плотных представлений, естественно не имеют четкого назначения ребер для каждой вершины.
Если назначение ребер не задано в данных, различные варианты ребер приведут к разному поведению и затратам памяти графовой нейронной сети.
Для этого имеет смысл начать с массива в качестве представления графа, например, это может быть изображение. Для массива размером MxN наименьшее количество ребер, соединяющих каждый узел с каждым другим узлом через несколько переходов, — это соединение текущего узла с предыдущим и следующим узлом. В этом случае есть M*N узлов и 2*M*N ребер.Простая свертка с одним переходом выполняет 2*M*N операций. Однако эта операция будет «медленной» — для того, чтобы информация об узле в середине массива достигла первого узла массива, потребуется около 0,5*M*N сверток.
Типичный подход, выбранный для свертки графа на изображениях, заключается в учете 8 прямых соседей для соединения ребер, в этом случае имеется 8*M*N ребер, следовательно, каждая простая свертка графа имеет стоимость 8*M*N . Чтобы информация из центрального узла массива достигла первого узла, имея возможность ходить по диагонали, требуется max (M, N) сверток.
Для так называемых подходов, основанных на самоконтроле, каждый узел будет связан со всеми остальными. Хотя для этого требуется (M*N)*(M*N) ребер, во время одной операции свертки информация любого узла может быть передана любому другому узлу.
Из всех этих трех примеров выше становится ясно, что количество ребер определяет сложность свертки. Это отличается от обычных сверточных слоев, где размеры фильтров часто имеют формат 3×3 и определяются схемой сети, а не входным изображением.
Дополнительная информация: плотные и разреженные свертки
Выбор плотного или разреженного представления влияет не только на использование памяти, но и на метод расчета. Плотные и разреженные тензоры графов требуют сверток графов, которые работают с плотными или разреженными входными данными (или, альтернативно, как видно в некоторых реализациях, преобразуются между разреженными и плотными внутри сетевого уровня). Тензоры разреженных графов будут работать с разреженными свертками, использующими разреженные операции. С очень наивной точки зрения было бы логично предположить, что плотные вычисления будут дороже, но быстрее разреженных, поскольку разреженные графы потребуют обработки операций в виде списка.Однако библиотеки для разреженных тензорных операций доступны как для PyTorch, так и для Tensorflow, которые упрощают и ускоряют разреженные операции.
Дополнительная информация: К другим критериям ребер
От сетки к k-ближайшим соседям: если узлы графа не расположены в сетке, как в примерах изображений, обобщение этого подхода заключается в поиске k-ближайших соседей для каждого узла. Этот подход можно дополнительно обобщить, используя входные данные характерных точек вместо положений в качестве координат узла, с функцией «расстояние» в настройке k-nn, служащей измерением сходства между функциями.
От евклидова расстояния к другим методам оценки: в то время как некоторые приложения графовых сетей выигрывают от физических координат или позиций пикселей (например, прогнозирование трафика или анализ изображений), другие графы и отношения ребер могут возникать из критериев сходства, основанных на связях или знаниях, таких как социальные сети или графики транзакций.
Визуализация сетей в Python. Практическое руководство по инструментам, которые помогают… | by Mohit Mayank
Практическое руководство по инструментам, которые помогут вам «увидеть» сеть
Фото Скотта Уэбба на UnsplashКаждый код из этой статьи опубликован в этом репозитории .
Обновление от 2 февраля 2021 г.: Недавно я выпустил Jaal, пакет Python для визуализации сети. Его можно рассматривать как 4-й вариант в списке, обсуждаемом ниже. Попробуйте. Подробнее читайте в этом отдельном блоге. Спасибо!
Сеть или график — это специальное представление объектов, которые имеют отношения между собой. Он состоит из набора двух универсальных объектов — (1) узел: который представляет объект, и (2) ребро: который представляет соединение между любыми двумя узлами.В сложной сети у нас также есть атрибуты или функции, связанные с каждым узлом и ребром. Например, человек, представленный в виде узла, может иметь такие атрибуты, как возраст, пол, зарплата и т. д. Точно так же ребро между двумя людьми, представляющее «дружескую» связь, может иметь такие атрибуты, как friends_since, last_meeting и т. д. Из-за такой сложной природы, становится необходимым, чтобы мы представили сеть интуитивно, чтобы она продемонстрировала как можно больше информации. Для этого нам сначала нужно познакомиться с различными доступными инструментами, и это тема этой статьи, т.е.е. чтобы просмотреть различные варианты, которые помогают нам визуализировать сеть. Давайте начнем!
Прежде чем погрузиться в визуализацию, давайте сначала разберемся, как выглядят данные графика и как мы можем загрузить их в память с помощью NetworkX в Python. Ниже мы можем увидеть табличную формулировку социальной сети «Игра престолов». Здесь узлы представляют символы GoT, а ребро между двумя символами означает, что их имена встречаются в книгах на расстоянии около 15 слов друг от друга.
Первые два столбца содержат узлы (здесь символы GoT), а одна пара Источник и Цель представляет границу между двумя символами.Только глядя на набор данных книги 1, мы имеем 187 уникальных символов и 684 соединения (строки). Кроме того, столбец весов дает представление о важности связи, здесь это количество раз, когда мы видели имена двух персонажей поблизости (как определено выше) в книге 1. Чтобы сделать сеть управляемой, мы учитываем только прочные соединения, сохраняя ребра с весами >10
. Это обрезает граф до 80 узлов (символов) и 175 ребер (соединений).
Загрузка этих данных в формате кадра данных pandas в виде сети довольно проста.Это можно сделать с помощью NetworkX следующим образом,
И все! Переменная G
теперь является графом networkx, на котором мы можем выполнять операции, связанные с графом. Теперь, когда все необходимое сделано, давайте рассмотрим различные варианты визуализации один за другим.
NetworkX имеет собственный модуль рисования, который предоставляет несколько вариантов построения графиков. Ниже мы можем найти визуализацию некоторых модулей рисования в пакете. Использовать любой из них довольно просто, так как все, что вам нужно сделать, это вызвать модуль и передать графическую переменную G
, а пакет сделает все остальное.
Хотя опция визуализации встроена в стандартный пакет python graph и ее довольно легко вызвать, она очень нелогична и подходит только для небольших сетей. В большинстве случаев в больших сетях любые вызовы встроенных модулей не имеют особого смысла. Это делает вариант по умолчанию не очевидным выбором, если вы используете большие сетевые данные. Еще один недостаток, он не интерактивен, поэтому график представляет собой фиксированный график. Это серьезный недостаток, поскольку есть и другие параметры, которые позволяют вам вручную взаимодействовать и играть с графиком.С этой репликой давайте перейдем к нашему следующему варианту.
PyVis — это интерактивный пакет Python для визуализации сети, который использует график NetworkX в качестве входных данных. Он также предоставляет несколько вариантов стиля для настройки узлов, краев и даже всего макета. И самое приятное то, что это можно сделать на ходу, используя панель настроек, где вы можете поиграть с различными параметрами и экспортировать окончательные настройки в виде словаря Python. Этот словарь позже может быть передан в качестве конфигурации при вызове функции, что приведет к отображению сети в том виде, в котором она была.Помимо этого, с точки зрения визуализации, у вас есть базовые возможности масштабирования, выбора, наведения и т. д. Круто не правда ли! 😉
По умолчанию нарисовать нашу сеть GoT можно легко,
Это отображает сеть как,
Одним из основных недостатков предыдущих вариантов является то, что их очень сложно использовать с интерактивными инструментальными панелями, такими как Dash. Это связано с тем, что помимо поддержки ручных взаимодействий, таких как выбор, масштабирование и т. д., пакет должен автоматически подстраиваться под программные взаимодействия, такие как изменение данных, изменение свойств и т. д.Эта функция поддерживается visdcc, который является портом visjs в Python. Это позволяет довольно легко изменить график или даже некоторые свойства выбора графика с помощью обратных вызовов, которые в Dash могут быть подключены к виджетам, таким как кнопки или параметры выбора переключателя. Пример приложения Dash для нашего набора данных GoT показан ниже,
Здесь код отображает сеть GoT, как мы это делали ранее. Кроме того, мы добавили обратный вызов на график, так что при выборе опции мы меняем цвет всего графика.Обратите внимание, что это фиктивный пример, поэтому полная область применения довольно огромна, например, добавление параметров поиска (найти любой символ), настройка фильтра по весам (переход от нашего фиксированного значения 10) и т. д. Приложение Dash с фиктивным примером выглядит так: показано ниже,
Цель этой статьи состояла в том, чтобы познакомить читателя с сетевыми данными и различными вариантами Python для их визуализации. Наш список опций начался со встроенного модуля построения графиков NetworkX, который можно использовать для визуализации небольших и несложных (меньше соединений) графиков.