BI-Art

  • 홈
  • 태그
  • 방명록

PYTHON 2

(pyspark+jupyterlab) Ubuntu내 분석 환경 설정

ubuntu 20.04 (multipass)python 3.8.9pyspark 3.3wget https://dlcdn.apache.org/spark/spark-3.3.1/spark-3.3.1-bin-hadoop3.tgzUbuntu 가상환경 셋팅multipass launch -c 2 -m 2G --name machine focal Pyspark 다운로드spakr 바이너리 파일을 다운로드 받는다. 여기엔 pyspark를 구동하는 라이브러리들이 모두 모아져 있다. https://www.apache.org/dyn/closer.lua/spark/spark-3.3.1/spark-3.3.1-bin-hadoop3.tgzwget https://dlcdn.apache.org/spark/spark-3.3.1/spark-3...

데이터 엔지니어링(Deep Dive) 2022.12.03

[Python] Child process 생성

작업 간에 별도의 프로세스를 만들어서 작업을 처리해야할 때가 있다. 가장 흔하게는 controller 역할을 하는 어플리케이션에서 worker 혹은 executor 등의 작업 주체를 만드는 경우가 있다. Airflow에서 Celery worker를 사용할 때가 그렇다. airflow는 worker들을 데몬으로 미리 띄워놓는게 아니라 작업이 수행되는 때에 필요에 따라 worker process를 띄워서 사용한다. 이번 포스트에서는 간략하게 python으로 child process를 띄우는 코드를 소개한다. import osprint(f'Current PID : {os.getpid()}')pid = os.fork()if pid > 0: _, ret = os.waitpid(pid, 0) print("Pare..

데이터 엔지니어링(Deep Dive) 2022.12.03
이전
1
다음
더보기
프로필사진

BI-Art

데이터와 함께하는 모든 직장생활을 위하여!

  • 분류 전체보기
    • IT 이모저모
    • 데이터 엔지니어링(Deep Dive)
    • 연구자료

Tag

docker gateway, MetaMask 설치, docekr bridge, dockerization, OpenSea 계정, ParquetFileReader, 스프링 도커, installtion, MetaMask, arch hades, java, PYTHON, ParquetWriter, nft 구매, 시 NFT, NFT, poem nft, 자바 저작권 분쟁, docker network, OpenSea,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/08   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바