본문 바로가기

기술스택을 쌓아보자/데이터 엔지니어링11

데이터 중심 애플리케이션 설계 - 복제 - 리더와 팔로워 복제: 네트워크로 연결된 여러 장비에 동일한 데이터의 복사본을 유지한다는 의미 복제가 필요한 이유 지리적으로 가깝게 유지해 지연 시간을 줄임 장애가 발생해도 지속적으로 동작하여 가용성 높임 장비의 수를 확충하여 읽기 처리량을 늘림 큰 데이터를 볼 때에는 파티셔닝을 살펴본다. 복제의 어려움은 변경처리에 있다. 복제를 위한 알고리즘 단일리더(single-leader): 다중리더(multi-leader) 리더없는(leader-less) 리더와 팔로워 replica: 복제된 데이터를 저장하는 각 노드 일반적인 해결책 리더기반 복제(leader-based replication) active , passive, master, slave) 리더가 되는 서버를 하나 지정한다(master, primary) 리더는 데이터.. 2023. 4. 18.
데이터중심 애플리케이션 설계 - 데이터플로 모드 데이터 플로란? 하나의 프로세스에서 다른 프로세스로 데이터를 전달하는 방법 데이터 베이스 호출을 통해, 서비스 호출을 통해, 비동기 메시지 전달을 통해 전할 .. 다양한 방법이 있다. 데이터 베이스를 통한 데이터플로 데이터베이스에 뭔가를 저장하는 일을 미래의 자신에게 메시지를 보내는 ㅣㅇㄹ처럼 생각할 수 있다. 데이터 베이스는 저장 후 미래의 자신에게 메시지를 보내는 일로 생각해보자 여기서 하위호환성이 필요하다. 복호화를 위해서 데이터 베이스는 동시에 다양한 프로세스가 접근할 수 잇다. 새로운 버전의 코드가 기록된 다음 현재 수행중인 예전 버전의 코드로 그 값을 읽을 가능성이 있다는 의미이다 따라서 상위 호환성도 필요하다. ⇒ 여기까지 데이터 베이스에서 상위 및 하위 호환성이 필요하다는 말 그런데, 새로.. 2023. 4. 15.
데이터 중심의 웹 애플리케이션 설계 - 1장 데이터 모델과 질의언어 부분 관계형 모델과 문서 모델 데이터 모델은 작성 뿐만 아니라 문제를 어떻게 생각해야하는지에 대해서도 지대한 영향을 끼친다. 각 계층은 명확한 데이터 모델을 제공해 하위 계층의 복잡성을 숨긴다.(잘된 추상화) 각 계층의 핵심적인 문제는 다음 하위계층 관점에서 데이터 모델을 표현하는 방법이다. 다양한 유형의 데이터모델이 있고, 각 데이터 모델은 사용 방법에 대한 가정을 나타낸다. 관계형 모델과 문서 모델 sql : 관계(relationship, columns)로 구성되고 각 관계는 튜플(tuple, rows)로 구성된다 관계형 데이터베이스의 근원은 컴퓨터에서 수행된 비즈니스 데이터처리에 있다.(트랜잭션 처리와 일괄처리) 1970~1980: 네트워크 모델, 계층 모델 ⇒ 관계형모델 1980~1990: 객체 데이터.. 2023. 4. 15.