Обсуждение:Верхнеуровневая архитектура

Материал из CAMaaS preliminary wiki
Перейти к навигации Перейти к поиску

Версия 1

Создал юз-кейс для централизованного варианта (когда все данные проходят через управляющую подсистему. Схему залил целиком ту, что мы нарисовали (с модификациями для читабельности). Ниже мои мысли по этой схеме.

По HTTPS.

Пользователь должен проходить аутентификацию и авторизацию на сервере - вводить логин/пароль. Процедуру авторизации/аутентификации придется все-равно писать самостоятельно. Предполагалось использовать следующий протокол.

Регистрация:

  1. Пользователь задает логин
  2. Пользователь задает ключ аутентификации (либо вычисляет его как хеш от пароля).
  3. Пользователь, используя известный открытый ключ сервера, шифрует логин/ключ и передает их серверу, сервер их сохраняет.

Аутентификация:

  1. Клиент генерирует случайную байтовую последовательность .
  2. Клиент вычисляет шифр .
  3. Клиент в открытом виде посылает и свой логин на сервер.
  4. Сервер, после получения запроса с и логином от клиента, вычисляет .
  5. Сервер генерирует случайное
  6. Сервер вычисляет .
  7. Сервер посылает и клиенту по открытому каналу.
  8. Клиент сравнивает и полученный , и, если имеется равенство, аутентификация сервера пройдена.
  9. Клиент вычисляет .
  10. Клиент посылает в открытом виде на сервер.
  11. Сервер проверяет равенство и и, если равенство истинно, аутентификация клиента пройдена.

При таком протоколе мы проводим аутентификацию и клиента, и сервера за раз. Алгоритмы шифрования при аутентификации используются симметричные, следовательно имеется большая производительность, по сравнению с асимметричными шифрами SSL. Единственное место, где возможно проведение атаки "человек-в-середине" и подмена сервера - регистрация, а именно не подтверждается подлинность открытого ключа сервера.

Имеет ли смысл использовать SSL и HTTPS?

--Андрей Чусов (обсуждение) 18:35, 7 июля 2015 (UTC)

В плане доверия к системе со стороны пользователя есть. --Nachinka (обсуждение) 09:26, 8 июля 2015 (UTC)

По СУБД

Готовым (и поставляемым) продуктом будет сервер со всеми сервисными подсистемами. Таким образом мы будет поставлять и СУБД - MariaDB. Вопрос с лицензированием - не придется ли открывать код?

Еще раз: назначение СУБД2 - бэкапы? Кто будет удалять ненужные проекты, если они хранятся на сервере?

--Андрей Чусов (обсуждение) 18:35, 7 июля 2015 (UTC)

Второй БД - это пользовательские данные - проекты, результаты расчётов. Может БД, может файловая структура. Модный облачный подход и мобильность пользователя. --Nachinka (обсуждение) 09:26, 8 июля 2015 (UTC)

Use-case

Часть юз-кейса с назначением физических параметров модели выглядит немного избыточной. Предлагаю:

  1. Пользователь обращается к управляющей подсистеме с запросом на ассоциацию данных из СУБД1 с компонентами геометрической модели для выбранной предметной области.
  2. Управляющая система считывает идентификаторы данных с СУБД2 и ассоциирует их с компонентами модели
  3. Управляющая подсистема делегирует запрос подсистеме предметной области.
  4. Подсистема предметной области считывает данные из СУБД напрямую по адресу, предоставленному управляющей подсистемой.
  5. Подсистема предметной области задает ассоциацию данных с компонентами геометрической модели.

--Андрей Чусов (обсуждение) 18:35, 7 июля 2015 (UTC)

По балансировке нагрузки

В старой схеме

Top struct.jpg

использовалось две системы балансировки нагрузки - глобальная - работающая как подсистема управляющей, и локальные, входящие в конкретную предметную область.

В такой схеме подразумевалось следующее: Подсистема предметной области включает в себя распределенных ЭВМ, каждая из которых имеет параллельных вычислителей: CPU и, если допускается использование GPU, то GPU. Соответственно, для предметной области D, задается "глобальная" балансировка нагрузка между элементами , в соответствии со значениями элементов .

Далее задается "локальная балансировка нагрузки" для одной ЭВМ .

Если мы исключим глобальную балансировку нагрузки из управляющей подсистемы, задача по реализации балансировке и управлению распределенными вычислителями предметной области ляжет на разработчика предметной области, хотя если использовать реализацию в виде разделяемого списка, заданного для каждой из предметных областей, мы не привязываемся к конкретным предметным знаниям (для нас параметры модельного эксперимента - просто данные с размером), но избавляем возможного потребителя, реализующего предметную область, от лишней работы и затрат.

--Андрей Чусов (обсуждение) 08:40, 8 июля 2015 (UTC)

Так мы, вроде, под конец обсуждения в итоге пришли к двойному контролю нагрузки. А может даже и три уровня надо продумать. Первый в системе управления. Второй общий для конкретной Предметной области. И третий для отдельного вычислительного узла. --Nachinka (обсуждение) 09:26, 8 июля 2015 (UTC)

Балансировку нагрузки между процессорами узлов предметной области целесообразно проводить локально во избежание пересылки параметров логических процессов по сети, которых может быть много. Эта балансировка может осуществляться аналогично глобальной - разделяемым (между процессорами одного узла) списком параметров имитационных экспериментов (логических процессов). Тогда, если появляется свободный процессор (т.е. по завершении рабочего потока, при завершении всех GPU потоков, а также при старте), он проверяет список на непустоту и, если список не пуст, запускает логический процесс с параметрами, считанными из списка. При появлении события сигнализируется событие, которого ожидает реализация предметной области. Последняя, в свою очередь, создает необходимые рабочие потоки. Такой протокол также не привязан к предметной области, поэтому его можно реализовать независимо от предметной области, однако, поскольку эта реализация работает в пространстве предметного узка, ее можно предоставлять в виде DLL/SO библиотеки либо в виде локального сервера (для поддержки балансировки между процессами, а не потоками).

Таким образом, мы имеем два уровня балансировки. Подсистема на первом уровне включена в управляющую подсистему, подсистемы на втором уровне выполняются в пространстве одного вычислительного узла.

--Андрей Чусов (обсуждение) 10:49, 8 июля 2015 (UTC)

По геометрической и графической подсистемам

Графическая подсистема служит для подготовки параметров для скрипта рисования на стороне клиентов, а подсистема геометрического моделирования хранит компоненты геометрической модели, с которыми работают пользователи. То есть, мы имеем довольно четкое разделение по функционалу.

Одно из требований к системе моделирования в целом - поддержка многопользовательской работы над одним (или разными) модельными проектами, возможно в разных предметных областях. При работе над одним проектом доступ к одной геометрической модели разделяется между пользователями, в отличие от графики (например, пользователи будут смотреть на сцену под разными углами). Сейчас, конечно, этим пока можно не заморачиваться, но разделение на графику и геометрию в каком-либо виде нужно будет обеспечивать.

--Андрей Чусов (обсуждение) 10:54, 8 июля 2015 (UTC)

Вариант структуры с доски

Top structure 3 draft.png