오피니언칼럼
[스마트안전 칼럼] 텍스트 마이닝 I안전의 숲과 나무 동시 보기
안전정보  |  safetyin@safetyin.co.kr
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2021.04.28  12:33:52
트위터 페이스북 미투데이 요즘 네이버 구글 msn
   
▲ 신동일 교수명지대학교 재난안전학과/ 스마트엔지니어링 전공dongil@mju.ac.kr

필자가 인공지능과 안전을 주제로 수학했던 퍼듀대는 유인 달탐사 아폴로 계획과 많은 인연을 맺고 있는데, 인류역사상 달에 처음 발을 디딘 닐 암스토롱, 공식적으로 마지막 유인탐사선이었던 아폴로 17호가 달을 떠나며 마지막 발을 떼었던 유진 서넌, 그리고 아폴로 1호 화재사고 희생자인 거스 그리섬의 모교로도 유명하다. 필자도 그리섬 빌딩에서 들었던, 인간공학 핸드북의 저자로도 유명한, 샐번디 교수의 인간공학 수업의 기억이 아직도 생생하다. 하지만 이와 더불어 퍼듀가 자랑하는 행사중의 하나가 매년 캠퍼스에서 열리는 전세계 루브 골드버그 기계장치 대회이다.

루브 골드버그 장치는 20세기 미국의 만화가 루브 골드버그가 고안한 기계장치들에서 연유하는데, 생김새나 작동원리는 아주 복잡하고 거창해 보이지만, 하는 일은 아주 단순한데다 재미만을 추구하는 매우 비효율적인 기계를 뜻한다. 얼핏 보면 진짜로 작동할 것처럼 생겼고, 작동 원리에 대해서는 다양한 상상을 요구하기도 한다(그림 2 참고). 특히 장치의 작동을 시작하기 위한 최초의 동력을 제외하면, 그 이후에 이어지는 장치 작동 동력들은 모조리 장치 내부에서 공급되어야 할 것을 골드버그 장치는 요구한다. 일상에서 간단하게 할 수 있는 일을 얼마나 복잡하게 만들면서 우리가 살아가는지 골드버그의 만화가 빗대어 보여 주었다면, 골드버그 기계장치 대회는, 만화가 골드버그의 스타일로, 간단한 작업을 완료하기 위해 최소 20 단계에서 최대 75 단계를 수행하는 장치를 만들 것을 요구한다 (참고: www.rubegoldberg.com/contests/). 

   
▲ 그림 1. 안전정보 발행인 칼럼(2017.10)에 대한 워드 클라우드 시각화 결과

2020년을 기준으로 초당 쌓이는 전세계 데이터의 양은 28.9 테라바이트(TB)였다 (참고로 인터넷에서 41만원에 쉽게 구입할 수 있는 하드디스크의 용량이 16 TB). 빅데이터가 넘쳐나는 요즘 세상에 존재하는 데이터의 80% 이상이 비정형 데이터로 추산되는데, 그 중에서도 텍스트는 가장 기본적이고 광범위한 비중을 차지하는 비정형 데이터이다. 

텍스트는 다루기 어려운 데이터중 하나이다. 모호하고 추상적인 단어로 가득차 있고, 같은 단어도 문맥에 따라 개념이 변하며, 유사한 개념도 표현하는 다양한 방법이 존재한다 (물론 필자의 연구실도 온톨로지와 지식그래프를 이의 해결을 위해 활용중이다). 일찍이 필자의 동료교수인 유홍준교수는 그의 명저 “나의 문화유산 답사기”에서 “아는 만큼 보임”을 주장했거니와, 다양한 안전관련 문서들을 파악함에 있어 우리는 적은 노력으로 나무와 숲을 동시에 볼 수 있기를 희망하는 때가 있는데, 인공지능에 기반한 텍스트 마이닝 기술은 이 측면에서 유용성이 크다.

그림 1은 기초적인 텍스트 마이닝 기술중 하나인 워드 클라우드를 활용해 본 안전정보에 고정적으로 게시되는 발행인 칼럼중 하나를 분석해본 예이다. 단어의 상대적 중요도와 더불어 연결관계까지 표현해주는 키워드 네트워크에 비해 기능은 떨어질 수 있어도, 사용이 쉽다는 장점이 있다. 안전의 숲과 나무를 동시에(즉 멀티스케일 분석) 볼 수 있기를 희망하는 안전인들을 위해, 방대한 문서 처리를 지원하는 스마트안전 도구중 하나로 텍스트 마이닝을 다음 편에서 깊이 다루고자 한다.

   
 
< 저작권자 © 안전정보 무단전재 및 재배포금지 >
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
인기기사
1
[재난안전칼럼] 장마
2
관계부처 합동, ㈜동방 및 전국지사에 대한 특별감독 실시
3
사망사고 발생 현대제철㈜ 특별감독 실시
4
한국건설안전학회, 춘계학술대회 개최
5
[파워인터뷰] 한명희 국토교통부 건설안전과장
6
[스마트안전 칼럼]스마트 안전 커뮤니케이션
7
[문화칼럼] 합창과 협업
8
질식 사망사고(2명) 발생 고려아연㈜ 강력조치 예정
9
안경덕 고용노동부 장관, 건설재해예방기관 간담회
10
국토안전관리원,전사적 위험성평가 실시
11
[발행인 칼럼] 평택항 사망사고에 대한 작은 생각
12
재난정보학회 제9대 회장에 김태환 용인대 교수
13
소방의 화재조사에 관한 법률 국회 통과
14
[초대석] 강국창 인천경영자총협회 회장
15
[우수건설현장 탐방] 포스코건설 광주오포1차공동주택현장
16
「건설근로자 기능등급 증명서」제1호 발급자 나와
17
[기고]건설현장 자재의 신뢰성·적합성 확인은 기본
18
[노무칼럼]변화되는 노동관계법 미리보기
19
부산소방, 소방관련법규 위반 사항 확인 점검 추진
20
여름철 폭염 대비 근로자 건강보호 대책 추진
회사소개개인정보취급방침청소년보호정책이메일무단수집거부
서울특별시 구로구 구일로 10길 27 (구로1동650-4) SK허브수오피스텔 B동 901호  |  대표전화 : 02)866-3301  |  팩스 : 02)866-3382
정기간행물ㆍ등록번호 : 서울특별시 아 01844  |  등록년월일 : 2011년 11월 22일  |  발행인·편집인 : 이선자  |   청소년보호책임자 : 오세용
Copyright © 2011 안전정보. All rights reserved. mail to safetyin@safetyin.co.kr