[오늘의 공부] 데이터 마이닝

in #kr7 years ago (edited)

데이터베이스 가운데 데이터 마이닝이라는 분야가 있다.

그중 clasification 은 데이터를 속성에 따라 분류하는 것이고,

clustering 은 유사한 데이터들을 군집화하는 것이다.

그리고 assocation rule (데이터 연관 규칙)은 데이터들 간의 연관규칙을 찾아내는 것이다.

예를 들면 대형 마트에서 사람들이 우유와 식빵을 동시에 구입할 확률이라던거,

인터넷 몰에서 영양팩을 사는 사람의 몇 퍼센트가 립스틱을 함께 구입하는 가를 알아내는 것,

유트브 서비스에서 어떤 동영상을 본 사람이 다른 관련 동영상으 볼 확률이라던가 등

assocation rule 은 다양한 분야에서 사용된다.



여기서 우리는 암호화된 데이터를 가지고 암호화된 데이터를 1)복호화 하지 않고

암호화된 데이터 상에서 assocation rule 을 알아내는 것이다.

이것이 활성화되면 마트에 있는 데이터를 암호화하여 안전하게 보관하면서도,

우리가 필요한 데이터 연관 규칙을 찾아낼 수 있다.

이 기술은 앞으로 클라우드 서비스의 핵심 기술이 될 것이다.

왜냐하면 클라우드 서비스가 기업에서 활성화가 늦어지는 이유는

기업이 보유한 데이터가 클라우드를 통해 유츌되는 염려 때문이다.


따라서 이러한 암호화된 데이터 상태에서의 데이터 마이닝 및 필요한 데이터 처리가

최근의 중요한 연구 주제이다.

두 줄 요약:데이터들의 관련성에대한 연구는 이미 되어있지만,
암호화된 데이터들의 관련성에대한 연구는 클라우드기술에 꼭 필요해서 연구주제로 쓸듯하다.

공부 끗 :)


  1. 복호화또는 디코딩은 부호화된 정보를 부호화되기 전으로 되돌리는 처리 혹은 그 처리 방식을 말한다. 보통은 부호화의 절차를 역으로 수행하면 복호화가 된다. 한편 복호기 또는 디코더는 복호화를 수행하는 장치나 회로, 컴퓨터 소프트웨어, 알고리즘 또는 사람을 말한다.

Coin Marketplace

STEEM 0.21
TRX 0.13
JST 0.030
BTC 67083.87
ETH 3502.60
USDT 1.00
SBD 3.13