컴퓨터는 텍스트를 이해하지 못한다. 때문에, 컴퓨터가 텍스트를 이해할 수 있도록 잘 표현해주어야 하는데, 우리는 그것을 Text Representation이라고 한다. 즉, 우리는 NLP에 있어서 항상 텍스트를 어떻게 컴퓨터가 이해할 수 있도록 변환할까를 계속 고민해야한다. 오늘은 컴퓨터가 텍스트를 이해할 수 있도록 변형하는 몇가지 기법을 소개해보고자 한다. 원-핫 인코딩(One-Hot Encoding) 원-핫 인코딩(One-Hot Encoding)은 문장내에 등장한 모든 단어의 차원을 나열한 것을 의미한다. 아래의 예시와 같이 문장이 있는 경우, 문장에 들어가는 단어의 수만큼 차원을 만들고 각 차원마다 단어의 위치를 지정하여 해당 단어가 나오는 차원에 1을 부여하는 것이다. Bag Of Words 원-..
오늘은 효율적인 데이터베이스 설계를 위한 정규화(Normalization) 개념을 정복해보고자 한다. Preview 좋은 관계형 데이터베이스를 설계하는 목적 중 하나는 정보의 이상(Anomaly) 현상이 생기지 않도록 하는 것이다. 데이터베이스에는 대표적으로 3가지 현상이 존재한다.Insertion anomalies(삽입 이상): 삽입 이상은 원하지 않는 자료가 삽입된다든지, 삽입하는데 자료가 부족하여 삽입이 되지 않는 문제를 의미한다.Deletion anomalies(삭제 이상): 삭제 이상은 하나의 자료만 삭제하고 싶지만, 그 자료가 포함된 튜플 전체가 삭제됨으로 원하지 않은 정보 손실이 발생되는 문제를 의미한다.Modification anomalies(갱신 이상): 갱신 이상은 정확하지 않거나 일부..
오늘은 DB Relationships에서 개인적으로 가장 이해하기가 껄끄러웠던 Recursive Relationships에 대해 정리한다. 이전 글https://baram1ng.tistory.com/28 Entity Relationships (2)앞서 Entity의 개념에 대해 설명했는데, 이번엔 Weak/Strong Entity, 그리고 (non)-ID-dependent 에 대해 간략하게 설명해보고자 한다. 이전 글https://baram1ng.tistory.com/27 Entity Relationships (1)DB를 설계할 때, 가장baram1ng.tistory.comRecursive Relationships(재귀적 관계) Recursive Relationships은 엔터티가 자기 자신과 관계를 갖..
앞서 Entity의 개념에 대해 설명했는데, 이번엔 Weak/Strong Entity, 그리고 (non)-ID-dependent 에 대해 간략하게 설명해보고자 한다. 이전 글https://baram1ng.tistory.com/27 Entity Relationships (1)DB를 설계할 때, 가장 중요하게 생각해야 할 부분이 바로 Entity Relationships이다. 오늘은 Entity Relationships에 대해 소개하고자 한다. 그전에 Entity를 모르는 사람들을 위해 Entity에 대한 정확한 정의를baram1ng.tistory.comWeak Entity Weak Entity란 Strong Entity없이는 무의미한 엔터티이다. 즉, DB에서 독립적으로 존재할 수 없는 Entity이다. ..
DB를 설계할 때, 가장 중요하게 생각해야 할 부분이 바로 Entity Relationships이다. 오늘은 Entity Relationships에 대해 소개하고자 한다. 그전에 Entity를 모르는 사람들을 위해 Entity에 대한 정확한 정의를 짚고 넘어가자. Entity 엔터티(Entity)란 업무에 필요하고 유용한 정보를 저장하고 관리하기 위한 집합이다. 즉, 우리가 추적하고 저장하기 위한 두루뭉술한 설계도라고 생각하면 될 것 같다. 엔터티는 Entity Class(엔터티 클래스)와 Entity Instance(엔터티 인스턴스)로 크게 분류가 될 수 있을 것 같다. (위 엔터티 클래스와 엔터티 인스턴스는 파이썬 Class 개념을 생각하면 될 것 같다.) Entity Class(엔터티 클래스)란, ..
웹/파이썬 프로그래밍 강의를 수강하면서 클래스에 대해 다시 한번 나만의 글로 정리할 필요가 있다고 생각하여 오랜만에 피드를 업로드한다. Class 개념 소위 말하는 우리가 말하는 객체 지향 프로그래밍의 시작이자 끝이 바로 Class다. 클래스는 객체(Object)를 표현하기 위한 문법이다. 클래스는 객체의 설계도 또는 큰 틀이라는 개념으로 이해할 수 있는데, 클래스를 통해 만들어진 객체를 인스턴스(Instance)라고 한다. 쉬운 이해를 위해 그림으로 이해해보자.앞서 클래스를 객체의 설계도라고 표현하였다. 위 그림으로 이해하면 클래스는 붕어빵을 만드는 붕어빵 틀이라고 할 수 있고, 붕어빵 틀을 통해 만들어진 붕어빵을 인스턴스라고 한다. 이 같이 객체를 사용한 프로그래밍 객체 지향 프로그래밍(OOP)라..