Tốt hơn là học python hay r?

Nói tóm lại, điều quan trọng nhất khi mới bắt đầu trong Khoa học dữ liệu là bạn LÀM Khoa học dữ liệu. Vì vậy, chỉ cần sử dụng một trong hai ngôn ngữ và ưu tiên hoàn thành một số dự án trong khi nhấm nháp đồ uống có đường mà bạn chọn. Đó là cách bạn sẽ học nhanh nhất

Ảnh của Fernando Hernandez trên Bapt

Mặc dù tôi có thể muốn giới thiệu Python ngay lập tức [Python là chính của tôi, nhưng tôi có một số kiến ​​thức về R], tôi muốn trình bày một đánh giá khách quan về hiệu quả của hai ngôn ngữ cho người mới bắt đầu. Điều này chủ yếu là do sự lựa chọn đúng đắn nhất chắc chắn sẽ phụ thuộc vào tình huống cụ thể của riêng bạn

Tại sao bạn lại muốn học?

Yếu tố đầu tiên và có lẽ là quan trọng nhất bạn phải xem xét là lý do TẠI SAO bạn muốn học. Ví dụ: nếu bạn là một nhà sinh vật học được đào tạo, đang tìm cách học một số kỹ năng lập trình để có thể hiểu rõ hơn về tập dữ liệu của mình hoặc bạn đã quen thuộc với các ngôn ngữ lập trình khoa học khác như MATLAB, thì bạn nên cân nhắc xem một số hướng dẫn về R trên YouTube vì nó sẽ . Hoặc nếu bạn là một kỹ sư phần mềm thành thạo các ngôn ngữ khác như C/C++ và Java và muốn chuyển sang Khoa học dữ liệu, Python sẽ là ngôn ngữ phù hợp giống như hầu hết các ngôn ngữ lập trình phổ biến khác, Python là một Lập trình hướng đối tượng . Hoặc, có thể gần đây bạn đã đọc về lĩnh vực Khoa học dữ liệu hấp dẫn và muốn tìm hiểu về nó. Trong trường hợp đó, một trong hai sẽ thực sự ổn và nó sẽ phụ thuộc nhiều vào các yếu tố khác hơn là yếu tố này

Bạn bè/đồng nghiệp của bạn đã là chuyên gia về một trong những ngôn ngữ này chưa?

Một lợi thế lớn mà bạn có thể có nếu bạn đang học một ngôn ngữ mới là sự hỗ trợ của cộng đồng. Nhận được sự giúp đỡ từ cộng đồng được khá nhiều lập trình viên mong đợi và thường được coi là một kỹ năng quan trọng. Là người mới bắt đầu, có thể khó hiểu khi tìm hiểu cách nhận trợ giúp, đặc biệt là vì không có nhiều tài nguyên trực tuyến về nghệ thuật nhận trợ giúp từ cộng đồng. Xây dựng trực giác và biết phải hỏi gì khi có lỗi trong mã là điều cần thiết. Nếu bạn biết ai đó thành thạo Python hoặc nếu một nhà nghiên cứu khác tại phòng thí nghiệm của bạn đang làm việc với R, thì tốt nhất bạn nên làm theo những gì họ biết vì sau đó bạn luôn có thể đặt câu hỏi cho họ nếu bạn gặp khó khăn.

Bạn chỉ quan tâm đến Thống kê và Phân tích dữ liệu hay muốn tìm hiểu các lĩnh vực khác như Học máy và Trí tuệ nhân tạo?

Một điểm khác biệt chính trong các tiện ích của Python và R là ngôn ngữ trước là một ngôn ngữ cực kỳ linh hoạt, so với ngôn ngữ sau. Python là ngôn ngữ lập trình chính thức, có nghĩa là bạn có thể thu thập, lưu trữ, phân tích và trực quan hóa dữ liệu, đồng thời tạo và triển khai các quy trình Machine Learning vào sản xuất hoặc trên trang web, tất cả chỉ bằng Python. Mặt khác, R hoàn toàn dành cho thống kê và phân tích dữ liệu, với các biểu đồ đẹp hơn và dễ tùy chỉnh hơn so với biểu đồ trong Python. R sử dụng cách tiếp cận Ngữ pháp đồ họa để trực quan hóa dữ liệu trong thư viện #ggPlot2 của nó và điều này cung cấp rất nhiều khả năng tùy chỉnh trực quan mà Python thiếu. Có lẽ hơi đơn giản hóa một chút, nhưng có thể hợp lý khi nói rằng nếu bạn muốn trở thành Nhà phân tích dữ liệu thì R nên là lựa chọn ưu tiên của bạn, trong khi nếu bạn muốn trở thành Nhà khoa học dữ liệu thì Python là lựa chọn tốt hơn. Đó là tình thế tiến thoái lưỡng nan của khái quát hóa vs. chuyên môn hóa

Suy nghĩ cuối cùng

Khoa học dữ liệu với tư cách là một lĩnh vực riêng biệt chỉ mới xuất hiện trong mười năm qua và kết quả là nó không ngừng phát triển. Nhưng điều nhất quán là ngày càng có nhiều đường dẫn dữ liệu được tự động hóa mỗi ngày. Những nhân viên có vô số kỹ năng như kỹ thuật dữ liệu, trực quan hóa dữ liệu, kỹ thuật Machine Learning, tích hợp dịch vụ đám mây và triển khai mô hình, sẽ luôn được yêu cầu nhiều hơn so với những người chỉ chuyên về một khía cạnh của quy trình Khoa học dữ liệu. Phần lớn sự phát triển của lĩnh vực này đã được định hình bằng tự động hóa và chỉ những nhân viên có kỹ năng lập trình tốt mới có thể chống lại điều đó. Chuyên xây dựng các mô hình Machine Learning ấn tượng sẽ không bị cắt giảm trong tương lai gần, tất nhiên trừ khi bạn cực kỳ giỏi về nó

Bối cảnh của ngành hiện tại là ở cấp độ mới bắt đầu, có quá nhiều ứng viên “khá” phù hợp với quá ít công việc Khoa học dữ liệu cấp dưới có sẵn. Nhưng đối với các vị trí cao hơn một chút, không có đủ học viên có kinh nghiệm hoặc có kỹ năng phù hợp. Và để thực hiện bước tiếp theo trong sự nghiệp của mình, cuối cùng bạn sẽ cần có khả năng hiểu và thực hiện các giai đoạn khác của quy trình làm việc ở một mức độ nào đó. Vậy tại sao không tạo cho mình xác suất thành công cao nhất?

Nếu bạn vẫn không chắc chắn về nó, lời khuyên tốt nhất tôi có thể đưa ra là hãy chọn Python ngay bây giờ và bắt đầu học. Sau này, khi bạn đã có kiến ​​thức làm việc khá tốt về nó, bạn cũng có thể học những kiến ​​thức cơ bản về R. Nhưng nếu bạn thực sự không cảm thấy thoải mái với Python, thì bạn biết phải làm gì rồi đó. Ưu tiên hàng đầu của bạn khi mới bắt đầu là cảm nhận các khái niệm cốt lõi của Khoa học dữ liệu và hiểu cách áp dụng các khái niệm này trong các tình huống thực tế trước hết. Thiết lập môi trường mã hóa có thể là một trải nghiệm hơi khó khăn đối với người không có nền tảng về lập trình hoặc Khoa học máy tính trước đó. Tuy nhiên, thiết lập và bắt đầu học sẽ là trải nghiệm liền mạch hơn nhiều với R so với Python. Quá nhiều người trong chúng ta sống với ý tưởng trở thành Nhà khoa học dữ liệu và không đủ thực sự hành động để trở thành một nhà khoa học dữ liệu.

5 giai đoạn học Khoa học dữ liệu

và làm thế nào để ace mỗi người trong số họ

hướng tới khoa học dữ liệu. com

4 lý do khiến mô hình học máy của bạn hoạt động kém hiệu quả

một cách tiếp cận sơ đồ để xây dựng các mô hình ML tốt hơn

hướng tới khoa học dữ liệu. com

Hiểu mô hình quan hệ của hệ quản trị cơ sở dữ liệu

và tại sao nó rất phổ biến trong toàn ngành

hướng tới khoa học dữ liệu. com

P. S. Nếu bạn muốn biết thêm các bài viết ngắn gọn, chính xác về Khoa học dữ liệu, Lập trình và cách một nhà sinh vật học điều hướng con đường của mình thông qua cuộc cách mạng Dữ liệu, hãy cân nhắc theo dõi blog của tôi

Với hàng nghìn video được tải lên mỗi phút, điều quan trọng là phải lọc chúng để bạn chỉ sử dụng dữ liệu có chất lượng tốt. Do chính tôi chọn, tôi sẽ gửi email cho bạn các video giáo dục về các chủ đề bạn quan tâm để tìm hiểu. Đăng ký tại đây

Chủ Đề