분류 전체보기 469

kafkacat & Kafka Lag exporter

https://blog.advenoh.pe.kr/cloud/kafkacat-%EC%82%AC%EC%9A%A9%EB%B0%A9%EB%B2%95-%EB%A9%94%EC%8B%9C%EC%A7%80-%EB%B3%B4%EB%82%B4%EA%B3%A0-%EB%B0%9B%EA%B8%B0-%ED%85%8C%EC%8A%A4%ED%8A%B8/ kafkacat 사용방법 (메시지 보내고 받기 테스트) 은 아파치 카프카를 쉽게 테스트하고 디버깅하는데 유용하게 사용할 수 있는 도구이다. 명령어를 통해서 메시지를 보내고 받거나 메타데이터 목록을 확인할 수 있다. 기본적인 사용방밥에 대해 blog.advenoh.pe.kr kcat -b pricing.net -t new -C -o end -f '\nKey (%K bytes): %k\..

BigData 2022.03.08

EDA

https://jalynne-kim.medium.com/%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D-%EA%B8%B0%EC%B4%88-eda%EC%9D%98-%EA%B0%9C%EB%85%90%EA%B3%BC-%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D-%EC%9E%98-%ED%95%98%EB%8A%94-%EB%B2%95-a3cac2cc5ebc [데이터분석 기초] EDA의 개념과 데이터분석 잘 하는 법 오늘 포스팅 주제는 ‘데이터분석 기본 — EDA(Exploratory Data Analysis, 탐색적 데이터 분석)에 관하여 #데이터전처리 #결측치 #pandas’ 이다. jalynne-kim.medium.com

BigData 2022.03.07

Spark 3.0

https://dalsacoo-log.tistory.com/entry/Spark-30-%ED%95%9C-%EB%B2%88%EC%97%90-%EC%A0%95%EB%A6%AC%ED%95%98%EA%B8%B0 Spark 3.0 한 번에 정리하기 Overview 본 포스트는 Spark Release 3.0 공식 페이지의 Jira 티켓을 참고하여 작성하였습니다. Spark 3.0에서 향상된 기능은 Structed streaming, MLlib의 library, SQL, DataFrame의 API에도 영향을 미침 최적화.. dalsacoo-log.tistory.com https://lightningdb.io/blog/2020/10/apache-spark-3.0-review.html Lightning DB - DRA..

BigData 2022.02.21

Redis HyperLogLog - Unique Data Check

https://minholee93.tistory.com/entry/Redis-HyperLogLog [Redis] HyperLogLog 이번 글에서는 redis의 unique count 기능인 HyperLogLog에 대해 알아보겠습니다. 1. HyperLogLog란? 효율적인 unique item count 기능을 제공해주는 기능입니다. 예를 들어 아래와 같이 특정 사이트에 방문자수를 minholee93.tistory.com https://tmdahr1245.tistory.com/119 [Redis] HyperLogLog [HyperLogLog란] HyperLogLog(hll)은 간단히 말하면 중복제거된 값을 매우 적은비용과 매우 빠른 속도로 계산하는데 사용하는 확률적 자료구조이다. 대용량의 데이터에서 중..

BigData 2021.11.11

AWS Chalice - AWS Lambda Web 프레임워크

AWS Chalice - AWS Lambda Web 프레임워크 - Flask 와 유사 - Schedule 이벤트 와 S3 이벤트도 지원 ** NodeJS ERR_OSSL_EVP_UNSUPPORTED 오류 발생을 피하기 위해 NODE_OPTIONS를 사용합니다. https://lsjsj92.tistory.com/575 AWS Chalice란? Python 기반 serverless framework chalice 사용하기 포스팅 개요 이번 포스팅은 AWS Chalice에 대해서 알아보려고합니다. AWS Chalice는 파이썬(Python) 기반의 serverless microframework로 알려져 있는데요~ serverless? 이게 뭘까요? 이 서버리스(serverless)가.. lsjsj92.tist..

AWS 2021.11.10

AWS DynamoDB Secondary Index

https://hello-world.kr/22 [DynamoDB] Secondary Index 설계원칙 및 고려사항 1. Secondary Index를 사용하는 이유 다음과 같은 은행 계좌를 관리하는 테이블을 생각해보자. OriginCountry가 Germany인 모든 데이터를 불러온다고 가정하자. Query를 통해서 불러오기 위해선 AccountID와 Crea hello-world.kr https://velog.io/@hanseul/AWS-DynamoDB-%EC%82%AC%EC%9A%A9%EA%B8%B0 AWS DynamoDB 사용기_보조 인덱스 사용 위주로 AWS DynamoDB의 보조 인덱스 사용법 velog.io

AWS 2021.11.10