생각보다 데이터를 보면서 사람들 앞에서 발표해야 할 경험들이 많았고 시각화가 발표에 있어서 전달력을 높여줄 수 있는 도구라고 생각해왔다. 그래서 계속 공부할 생각만 하고 있었는데, 이번에 마침 BOAZ에 합격하여 태블로 시각화 툴을 다루게 되어 앞으로 태블로와 시각화에 대해서 정리해보고자 한다. 좋은 시각화 항상 시각화라고 다 좋은 시각화는 아니며, 비전공자도 살펴보면 한번에 이해할 수 있는 시각화를 어떻게 하면 만들어낼 수 있을까에 대한 고민이 있었다. BOAZ 시각화 세션을 통해 좋은 시각화에 대한 정의를 3가지로 정의할 수 있었다. 수치, 통계적 결과만으로는 보이지 않는 패턴 파악이 가능한 시각화.전문적인 지식 없이도 쉽게 이해할 수 있는 시각화강력한 프레젠테이션을 통해 해당 정보의 영향력을 강화할..
컴퓨터는 텍스트를 이해하지 못한다. 때문에, 컴퓨터가 텍스트를 이해할 수 있도록 잘 표현해주어야 하는데, 우리는 그것을 Text Representation이라고 한다. 즉, 우리는 NLP에 있어서 항상 텍스트를 어떻게 컴퓨터가 이해할 수 있도록 변환할까를 계속 고민해야한다. 오늘은 컴퓨터가 텍스트를 이해할 수 있도록 변형하는 몇가지 기법을 소개해보고자 한다. 원-핫 인코딩(One-Hot Encoding) 원-핫 인코딩(One-Hot Encoding)은 문장내에 등장한 모든 단어의 차원을 나열한 것을 의미한다. 아래의 예시와 같이 문장이 있는 경우, 문장에 들어가는 단어의 수만큼 차원을 만들고 각 차원마다 단어의 위치를 지정하여 해당 단어가 나오는 차원에 1을 부여하는 것이다. Bag Of Words 원-..
오늘은 효율적인 데이터베이스 설계를 위한 정규화(Normalization) 개념을 정복해보고자 한다. Preview 좋은 관계형 데이터베이스를 설계하는 목적 중 하나는 정보의 이상(Anomaly) 현상이 생기지 않도록 하는 것이다. 데이터베이스에는 대표적으로 3가지 현상이 존재한다.Insertion anomalies(삽입 이상): 삽입 이상은 원하지 않는 자료가 삽입된다든지, 삽입하는데 자료가 부족하여 삽입이 되지 않는 문제를 의미한다.Deletion anomalies(삭제 이상): 삭제 이상은 하나의 자료만 삭제하고 싶지만, 그 자료가 포함된 튜플 전체가 삭제됨으로 원하지 않은 정보 손실이 발생되는 문제를 의미한다.Modification anomalies(갱신 이상): 갱신 이상은 정확하지 않거나 일부..
오늘은 DB Relationships에서 개인적으로 가장 이해하기가 껄끄러웠던 Recursive Relationships에 대해 정리한다. 이전 글https://baram1ng.tistory.com/28 Entity Relationships (2)앞서 Entity의 개념에 대해 설명했는데, 이번엔 Weak/Strong Entity, 그리고 (non)-ID-dependent 에 대해 간략하게 설명해보고자 한다. 이전 글https://baram1ng.tistory.com/27 Entity Relationships (1)DB를 설계할 때, 가장baram1ng.tistory.comRecursive Relationships(재귀적 관계) Recursive Relationships은 엔터티가 자기 자신과 관계를 갖..
앞서 Entity의 개념에 대해 설명했는데, 이번엔 Weak/Strong Entity, 그리고 (non)-ID-dependent 에 대해 간략하게 설명해보고자 한다. 이전 글https://baram1ng.tistory.com/27 Entity Relationships (1)DB를 설계할 때, 가장 중요하게 생각해야 할 부분이 바로 Entity Relationships이다. 오늘은 Entity Relationships에 대해 소개하고자 한다. 그전에 Entity를 모르는 사람들을 위해 Entity에 대한 정확한 정의를baram1ng.tistory.comWeak Entity Weak Entity란 Strong Entity없이는 무의미한 엔터티이다. 즉, DB에서 독립적으로 존재할 수 없는 Entity이다. ..