DataFrame ์ ํ๊ณผ ์ด์ด ์๋ ๋ฐ์ดํฐ ํ ์ด๋ธ์ ๋ํ๋ด๋ฉฐ, DataFrame ๊ฐ๋ ์ ์ด๋ค ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์์๋ ๋ณํ์ง ์์ง๋ง Spark ์ Pandas ์ DataFrame ์ ์๋นํ ๋ค๋ฅด๋ค. ์ด ๊ธ์์๋ Spark DataFrame๊ณผ Pandas DataFra,e์ ์ฐจ์ด์ ์ ์์๋ณด๋ ค๊ณ ํฉ๋๋ค. Pandas DataFrame Panda๋ NumPy ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ ์คํ ์์ค Python ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋๋ค. ๋ค์ํ ๋ฐ์ดํฐ ๊ตฌ์กฐ์ ์ฐ์ฐ์ ์ฌ์ฉํ์ฌ ์์น ๋ฐ์ดํฐ์ ์๊ณ์ด์ ์กฐ์ํ ์ ์๋ Python ํจํค์ง์ ๋๋ค. ์ฃผ๋ก ๋ฐ์ดํฐ ๊ฐ์ ธ์ค๊ธฐ ๋ฐ ๋ถ์์ ์๋นํ ์ฝ๊ฒ ํ๊ธฐ ์ํด ์ฌ์ฉ๋ฉ๋๋ค. Panda DataFrame์ ๋ ์ด๋ธ์ด ์ง์ ๋ ์ถ(ํ ๋ฐ ์ด)์ ๊ฐ์ง ์ ์ฌ์ ์ผ๋ก ์ด์ง์ ์ธ 2์ฐจ์ ํฌ๊ธฐ ๊ฐ๋ณ ํ ํ์ ..