Проект CIMA

cima logo 400

CIMA – Интелигентно свързване на данни за компании от различни източници

Начало 25.05.2018, Край 24.05.2020

Проектът “Интелигентно свързване на данни за компании от различни източници” (CIMA) се финансира от Европейския фонд за регионално развитие” по процедура BG16RFOP002-1.005 „Разработване на продуктови и производствени иновации“ по Оперативна програма „Иновации и конкурентоспособност 2014-2020“.

Европейски фонд за регионално развитие: 662 664.33 лв.
Национален фонд: 116 940.79 лв
Общ бюджет: 1 520 570.24 лв.

CIMA има за цел да използва технологии за изкуствен интелект (AI – Artificial Intelligence) за свързване и хармонизиране на данни от различни източници. Проектът ще използва машинно обучение (machine learning), семантично моделиране и интегриране на данни, както и логично вадене на изводи и валидиране, което да хармонизира, интегрира, свързва и прави по-лесни за използване данни на компании (хора, локации, браншови таксономии и различни технологични сфери).

Контакт: Владимир Алексиев

Обзор на проекта

Икономическата информация за компании е от решаващо значение за много бизнес операции. Тя позволява управлението на взаимоотношенията с клиентите, привличането на нови клиенти, маркетинговите кампании, управлението на веригите за доставка, пазарните анализи, разузнаването на конкуренцията, сливанията и придобиванията, и много други области. В днешно време в света има около 300 милиона юридически лица. Въпреки че наборите от корпоративни данни могат да бъдат придобити от множество източници, все още липсват достатъчно добри и задълбочени инструменти за интегриране на данните в пазарните и бизнес анализи.

За създаването на такъв инструмент трябва да бъде обединена информацията от различни източници с разнообразна структура на данните и методи за достъпването им. В момента корпоративни данни могат да бъдат открити в официалните фирмени регистри на много държави, в отворени платформи (като DBpedia, Wikidata, Panama Papers), в полу-търговски източници (като OpenCorporates), в търговски източници (като Dun & Bradstreet, Bureau van Dijk, Factset, S&P Capital IQ), в бази данни с инвестиционна информация (като Crunchbase и CBI) и др. Често необходимата информация е откриваема само в новините или в други текстови източници като например данни за финансовите резултати или за фирменото ръководство.

Целта на проекта CIMA е да хармонизира данните чрез семантично представяне и интеграция и да разработи методи за семантично съвпадение, свързване и извличане на обекти за избрания домейн. Той включва и предварителни проучвания за създаването на среда за хостинг и потребление на данни.

Ролята на Онтотекст

В рамките на проекта CIMA „Онтотекст“ планира да използва дългогодишната си експертиза и опит в областта на когнитивните анализи на данни, на база на която е създадена Ontotext Platform. Тази платформа улеснява интеграцията на разнообразна структурирана информация и текстове в мащабни „Графове на знание“ (Knowledge Graphs), които включват информация за милиарди концепции и взаимоотношенията между тях.

CIMA ще укрепи бизнес линията на „Онтотекст“ за разработване на продукти, услуги и решения за събиране на информация за световните пазари, които имат най-голям потенциал за растеж. Екипът на „Онтотекст“ вече е създал решения в тази област за някои от най-големите компании за бизнес информация, консултанти по сливания и придобивания. Тези решения съчетават отворени данни и данни от повечето глобални доставчици на корпоративни данни.

Целта на проекта CIMA е да инвестира в изследователска и развойна дейност, която в последствие да направи доставката на такива решения много по-ефективна. Проектът ще подпомогне добавянето на нови функционалности към водещите продукти на „Онтотекст“ – Ontotext Platform и Ontotext Cognitive Cloud. Това ще повиши конкурентоспособността на компанията и ще разшири пазара на тези продукти.

Английски версия

Ontotext Newsletter