본문 바로가기

데이터 수집

(2)
빅데이터와 개인정보보호법. 원격의료와 관련하여.. 최근에 U헬스케어 산업과 관련하여, 원격진료를 위해 개인의 신체의 정보를 병원이나 통신사와 같은 중간업체가 이를 활용할 때 발생될 수 있는 사생활 침해나 개인정보 유출로 인한 오용이 있을수 있기때문에, 법적으로 정보보호의 범위나 활용 범위를 정해야 한다는 이야기가 뉴스를 통해 많이 나오고 있다. 개인정보 중에서도 이런 의료정보를 민감정보로 규정되어 있어서, 개인에서 정보의 이용동의를 얻는 것은 필수적이라 한다.의료정보 뿐만이 아니라, 어떠한 데이터이건 그 출처가 개인일 경우에 그 활용이나 소유권에 대한 명확한 규정이 필요하다. 그래야, 추후에 발생할 수 있는 법적인 문제를 서비스업체는 피할 수 있다. 이런 의료정보에서도 개인 식별자인 주민등록번호, 주소, 전화번호와 같은것을 제거하면 연구목적으로 활용이 ..
python을 이용한 google 검색 데이터 수집 글쎄.. 잘은 모르겠다. 이렇게 접근하고 있는 것이 과연 적절한 방법인지. 어떤 로봇이든 agent든.. 사람이 아닌 기계가 어떤 객체를 이해한다는 것은 무엇을 의미하는가. 영상이든 음성이든 인식을 한다는 것과 이해를 한다는 것은 다르다. 영상을 인식한다는 것은 영상에 나타난 어떤 객체의 특징을 보고 이 객체의 이름이 무엇인지를 기존에 학습한 데이터에서 분류를 하는 것이다. 학습하지 않은것은 당연히 무엇인지 알 수 없다. 지금 하고자 하는 것은 인식의 문제가 아니라, 인식이 이루어지고 난뒤에 그 객체가 가지는 특성, 개념들을 우리가 임의로 정의하지 않고 얻을 수 있는 방법이 무엇이 있을까를 고민하다가, 매일 접하는 웹에서 데이터를 일단 얻어보기로 했다. 아무래도, 객체의 특성이나 객체들이 개념들이 for..