Hướng dẫn python vs stata speed - python và tốc độ stata

    • Ngày tham gia: Mar 2021Mar 2021
    • Bài viết: 55

    Điểm thuận lợi nhất của Stata so với Python hoặc R là gì?

    Điểm thuận lợi của Stata như một công cụ phân tích dữ liệu là gì?

    Đây là một câu hỏi rất đơn giản nhưng phù hợp để tôi tiến hành công việc của mình. Thật vậy, tôi muốn biết sâu hơn về Stata vì nó được yêu cầu trong môi trường làm việc hiện tại. Bạn có vui lòng đưa ra bất kỳ ý kiến ​​về các câu hỏi trên không?

    Lưu ý thêm

    Bây giờ tôi đang học kinh tế tại Trường Kinh tế sau đại học Tokyo. Trước khi tham gia ở đây, tôi đã là một nhà khoa học dữ liệu và do đó tôi đã sử dụng Fortran, C ++. Python, R, TensorFlow dưới dạng các công cụ phân tích dữ liệu. Tôi cũng đã sử dụng SQL để thao túng cơ sở dữ liệu thương mại.

    • Ngày tham gia: tháng 8 năm 2018Aug 2018
    • Bài viết: 27772777

    Những người khác nhau sẽ cho bạn câu trả lời khác nhau. Câu trả lời của tôi là:

    Stata không thể so sánh với Python, bởi vì cái sau là ngôn ngữ lập trình mục đích chung và Stata là ngôn ngữ thống kê/hồi quy cụ thể.

    Stata có thể so sánh với R, nhưng chúng rất khác nhau. Cú pháp của Stata rất giống với nhiều ngôn ngữ thống kê/hồi quy như TSP, RATS, EVIEWS, GRETL, v.v. R dựa trên một số ngôn ngữ thống kê [tuyệt chủng bây giờ] được gọi là S, và có cú pháp rất khác nhau.

    Tôi hiếm khi viết các chương trình mà người khác phải sử dụng. Đối với nghiên cứu của riêng tôi, Stata có lợi thế so với R rằng mọi thứ ở Stata đều đơn giản và nhanh chóng, và cú pháp của Stata là điều tự nhiên đối với tôi, trong khi mọi thứ đều khó và chậm, và cú pháp của R là không tự nhiên với tôi.

    Nhưng tôi đang nói những điều này như một người đã sử dụng Stata liên tục từ năm 2000 cho đến nay và là người có 4 tháng kinh nghiệm với R.

    Tôi đã làm bằng tiến sĩ của tôi. Tại Đại học Pompeu Fabra, và trong một vài năm, tôi là trợ lý giảng dạy của nhà thống kê vĩ đại của Catalan Albert Satorra. Giáo sư Satorra đã rất hào hứng với R và anh ấy đã nói về R thường xuyên trong các cuộc trò chuyện của chúng tôi, và một năm tôi quyết định cho bản thân sự vĩ đại của R. Tôi đã lấy kinh tế lượng trong r bởi Grant V. Farnsworth, và hơn 4 tháng đã từ từ đi qua Tất cả mọi thứ được mô tả trong hướng dẫn này cho R. Vâng, tôi không thích R chút nào, tôi không thấy bất cứ điều gì trong R mà tôi không thể làm ở Stata dễ dàng hơn rất nhiều, và tôi không bao giờ chạm vào R sau đó.

    Cuối cùng tôi nghĩ rằng tất cả là một vấn đề của hương vị.

      • 1 lượt thích

      Bình luận

      • Ngày tham gia: tháng 7 năm 2016Jul 2016
      • Bài viết: 16131613

      Đối với quan điểm của riêng tôi, tôi tìm thấy câu hỏi về loại "Phần mềm X tốt hơn phần mềm y?" Không thú vị cũng không hữu ích. Tôi cũng không đồng ý rằng đó là một câu hỏi đơn giản. Bất kỳ câu hỏi nào như vậy ngầm giả định rằng bạn - người đọc - hiểu và có một số trình độ trong X và Y. [nếu không, cuộc thảo luận là kết quả.] Do đó, mọi câu trả lời đều là chủ quan và bị vùi dập trong các khả năng tương đối của người trả lời. Việc so sánh đó có ý nghĩa gì với bạn hay không phụ thuộc vào các giả định chưa biết về bạn. Ví dụ, bạn thông thạo như thế nào trong mỗi ngôn ngữ? Bạn có quyền truy cập/quyền sử dụng nào? Có một khía cạnh quan trọng cần được tối ưu hóa, như bộ nhớ hoặc tốc độ, hoặc bất kỳ giải pháp hợp lý nào cho vấn đề trong tay là đủ? Có các yếu tố bên ngoài cần được xem xét, chẳng hạn như chi phí thời gian cho việc đào tạo của bạn, chi phí tài chính của phần mềm hoặc cơ sở hạ tầng, cấp phép phần mềm hoặc đồng nghiệp có thể cần phải gỡ lỗi/sử dụng mã hoặc các quy trình chi phối cách thức hoặc nơi mã được áp dụng? Tất cả những điều này quan trọng với bạn nhưng có thể không quan trọng với người khác.the reader – understand and have some proficiency in X and Y. [Otherwise, the discussion is moot.] As a result, every answer is subjective and couched in the relative abilities of the responder. Whether that comparison means anything to you depends on unknown assumptions about you. For example, how fluent are you in each language? Which do you have access/permission to use? Is there a crucial aspect that needs to be optimized, like memory or speed, or will any reasonable solution to the problem at hand be sufficient? Are there external factors that need to be considered, such as time cost of your training, financial cost of the software or infrastructure, software licensing, or colleagues that may need to debug/use the code, or processes that govern how or where the code is to be applied? All of these matter to you but may not matter to others.

      Điều đó có nên ngăn bạn học nhiều ngôn ngữ không? Chắc chắn là không rồi. Bạn sẽ dành nhiều thời gian hơn trong một ngôn ngữ khác? Gần như chắc chắn. Nếu bạn học được nhiều ngôn ngữ, thì sẽ không đau khi tìm hiểu về từng ngôn ngữ sâu sắc hơn khi bạn có được kinh nghiệm.

      Câu thần chú "chọn công cụ phù hợp cho công việc phù hợp" xuất hiện trong tâm trí. Tôi chắc chắn rằng bạn biết điều này đã được cung cấp kinh nghiệm về ngôn ngữ lập trình, bất cứ điều gì có thể được thực hiện trong một ngôn ngữ có thể được thực hiện trong một ngôn ngữ khác. Điều đó không có nghĩa là bạn có thể, hoặc thậm chí nên, phát minh lại bánh xe. Điều đó nói rằng, bạn đề cập rằng bạn được yêu cầu sử dụng Stata cho chương trình sau đại học của mình, do đó, bản thân nó là một câu trả lời.

        • 3 lượt thích

        Bình luận

        • Ngày tham gia: tháng 7 năm 2016Dec 2016
        • Bài viết: 1613595

        Đối với quan điểm của riêng tôi, tôi tìm thấy câu hỏi về loại "Phần mềm X tốt hơn phần mềm y?" Không thú vị cũng không hữu ích. Tôi cũng không đồng ý rằng đó là một câu hỏi đơn giản. Bất kỳ câu hỏi nào như vậy ngầm giả định rằng bạn - người đọc - hiểu và có một số trình độ trong X và Y. [nếu không, cuộc thảo luận là kết quả.] Do đó, mọi câu trả lời đều là chủ quan và bị vùi dập trong các khả năng tương đối của người trả lời. Việc so sánh đó có ý nghĩa gì với bạn hay không phụ thuộc vào các giả định chưa biết về bạn. Ví dụ, bạn thông thạo như thế nào trong mỗi ngôn ngữ? Bạn có quyền truy cập/quyền sử dụng nào? Có một khía cạnh quan trọng cần được tối ưu hóa, như bộ nhớ hoặc tốc độ, hoặc bất kỳ giải pháp hợp lý nào cho vấn đề trong tay là đủ? Có các yếu tố bên ngoài cần được xem xét, chẳng hạn như chi phí thời gian cho việc đào tạo của bạn, chi phí tài chính của phần mềm hoặc cơ sở hạ tầng, cấp phép phần mềm hoặc đồng nghiệp có thể cần phải gỡ lỗi/sử dụng mã hoặc các quy trình chi phối cách thức hoặc nơi mã được áp dụng? Tất cả những điều này quan trọng với bạn nhưng có thể không quan trọng với người khác.

        Điều đó có nên ngăn bạn học nhiều ngôn ngữ không? Chắc chắn là không rồi. Bạn sẽ dành nhiều thời gian hơn trong một ngôn ngữ khác? Gần như chắc chắn. Nếu bạn học được nhiều ngôn ngữ, thì sẽ không đau khi tìm hiểu về từng ngôn ngữ sâu sắc hơn khi bạn có được kinh nghiệm.

          • 1 lượt thích

          Bình luận

          • Ngày tham gia: Tháng 9 năm 2018Sep 2018
          • Bài viết: 255255

          Tôi khá mới [bật và tắt khoảng 2 năm] đến Stata và lý do số 1 của tôi là đường cong học tập rất thấp để thực hiện ước tính hoàn toàn mới ở Stata. Thường thì, tôi không biết ngày mai sẽ mang lại điều gì. Sử dụng Stata, tôi đã có thể tiến hành phân tích cụm trong vòng chưa đầy 10 phút mà tôi chưa từng làm trước đây. Trong R, bất cứ khi nào tôi cố gắng làm một cái gì đó mới [không nhiều lần công bằng], tôi thường thấy mình phải đối mặt với các thông báo lỗi thường liên quan đến việc quản lý môi trường [kích thước của ma trận này mà ma trận, v.v.]. Khi tôi cố gắng tìm ra vấn đề, tôi đã gặp khó khăn trong việc tìm hiểu tổng quan toàn diện về quy trình mà tôi đang cố gắng thực hiện. R là nguồn mở nhưng có một công ty đằng sau Stata. Họ đảm bảo mọi thứ cần thiết từ người dùng là tối thiểu và tất cả các thủ tục đều được ghi lại. Tất nhiên, Stata không miễn phí nhưng giá cho tôi rất nhiều lần có lợi ích là không dành nhiều giờ để xử lý các thông báo lỗi khi cố gắng tìm ra cách đúng đắn.

          Được chỉnh sửa lần cuối bởi Oscar Ozfidan; 22 tháng 3 năm 2021, 00:13.22 Mar 2021, 00:13.

            • 1 lượt thích

            Bình luận

            • Ngày tham gia: Tháng 9 năm 2018Jan 2015
            • Bài viết: 255280

            Tôi khá mới [bật và tắt khoảng 2 năm] đến Stata và lý do số 1 của tôi là đường cong học tập rất thấp để thực hiện ước tính hoàn toàn mới ở Stata. Thường thì, tôi không biết ngày mai sẽ mang lại điều gì. Sử dụng Stata, tôi đã có thể tiến hành phân tích cụm trong vòng chưa đầy 10 phút mà tôi chưa từng làm trước đây. Trong R, bất cứ khi nào tôi cố gắng làm một cái gì đó mới [không nhiều lần công bằng], tôi thường thấy mình phải đối mặt với các thông báo lỗi thường liên quan đến việc quản lý môi trường [kích thước của ma trận này mà ma trận, v.v.]. Khi tôi cố gắng tìm ra vấn đề, tôi đã gặp khó khăn trong việc tìm hiểu tổng quan toàn diện về quy trình mà tôi đang cố gắng thực hiện. R là nguồn mở nhưng có một công ty đằng sau Stata. Họ đảm bảo mọi thứ cần thiết từ người dùng là tối thiểu và tất cả các thủ tục đều được ghi lại. Tất nhiên, Stata không miễn phí nhưng giá cho tôi rất nhiều lần có lợi ích là không dành nhiều giờ để xử lý các thông báo lỗi khi cố gắng tìm ra cách đúng đắn.

            Được chỉnh sửa lần cuối bởi Oscar Ozfidan; 22 tháng 3 năm 2021, 00:13.
            Finally I believe the quality of articles in and programs discussed in The Stata Journal is very high. This helps to maintain a pool of high quality software.

              • 1 lượt thích

              Bình luận

              • Ngày tham gia: Tháng 9 năm 2018Feb 2021
              • Bài viết: 25515

              Tôi khá mới [bật và tắt khoảng 2 năm] đến Stata và lý do số 1 của tôi là đường cong học tập rất thấp để thực hiện ước tính hoàn toàn mới ở Stata. Thường thì, tôi không biết ngày mai sẽ mang lại điều gì. Sử dụng Stata, tôi đã có thể tiến hành phân tích cụm trong vòng chưa đầy 10 phút mà tôi chưa từng làm trước đây. Trong R, bất cứ khi nào tôi cố gắng làm một cái gì đó mới [không nhiều lần công bằng], tôi thường thấy mình phải đối mặt với các thông báo lỗi thường liên quan đến việc quản lý môi trường [kích thước của ma trận này mà ma trận, v.v.]. Khi tôi cố gắng tìm ra vấn đề, tôi đã gặp khó khăn trong việc tìm hiểu tổng quan toàn diện về quy trình mà tôi đang cố gắng thực hiện. R là nguồn mở nhưng có một công ty đằng sau Stata. Họ đảm bảo mọi thứ cần thiết từ người dùng là tối thiểu và tất cả các thủ tục đều được ghi lại. Tất nhiên, Stata không miễn phí nhưng giá cho tôi rất nhiều lần có lợi ích là không dành nhiều giờ để xử lý các thông báo lỗi khi cố gắng tìm ra cách đúng đắn.

              Được chỉnh sửa lần cuối bởi Oscar Ozfidan; 22 tháng 3 năm 2021, 00:13.

              Ngày tham gia: tháng 1 năm 2015

              Bài viết: 280

                • Tôi đồng ý với Asjad Naqvi và Marc Kaulisch.

                Bình luận

                • Ngày tham gia: Tháng 9 năm 2018Jun 2015
                • Bài viết: 2551240

                Tôi khá mới [bật và tắt khoảng 2 năm] đến Stata và lý do số 1 của tôi là đường cong học tập rất thấp để thực hiện ước tính hoàn toàn mới ở Stata. Thường thì, tôi không biết ngày mai sẽ mang lại điều gì. Sử dụng Stata, tôi đã có thể tiến hành phân tích cụm trong vòng chưa đầy 10 phút mà tôi chưa từng làm trước đây. Trong R, bất cứ khi nào tôi cố gắng làm một cái gì đó mới [không nhiều lần công bằng], tôi thường thấy mình phải đối mặt với các thông báo lỗi thường liên quan đến việc quản lý môi trường [kích thước của ma trận này mà ma trận, v.v.]. Khi tôi cố gắng tìm ra vấn đề, tôi đã gặp khó khăn trong việc tìm hiểu tổng quan toàn diện về quy trình mà tôi đang cố gắng thực hiện. R là nguồn mở nhưng có một công ty đằng sau Stata. Họ đảm bảo mọi thứ cần thiết từ người dùng là tối thiểu và tất cả các thủ tục đều được ghi lại. Tất nhiên, Stata không miễn phí nhưng giá cho tôi rất nhiều lần có lợi ích là không dành nhiều giờ để xử lý các thông báo lỗi khi cố gắng tìm ra cách đúng đắn.Brian Poi View Post

                Được chỉnh sửa lần cuối bởi Oscar Ozfidan; 22 tháng 3 năm 2021, 00:13.

                Được chỉnh sửa lần cuối bởi Oscar Ozfidan; 22 tháng 3 năm 2021, 00:13.

                Trong dữ liệu chuỗi thời gian của Stata rất dễ làm việc. Trong R, tôi cần nhập các thư viện chỉ để tuyên bố rằng tôi có dữ liệu chuỗi thời gian và các nhà khai thác như khách hàng tiềm năng, độ trễ và sự khác biệt là nhiều hơn nhiều so với Stata.

                Nói tóm lại, để thực hiện phân tích thống kê, một chương trình như Stata [hoặc như một thứ hai xa, EViews] đòi hỏi ít lập trình hơn để thực hiện các phân tích thường xuyên hàng ngày. Tất nhiên, với bất kỳ phân tích thống kê nghiêm túc, một số lượng lập trình là cần thiết và thuận lợi. Nhưng một nửa mã của tôi không nên được dành riêng để thực hiện lại những thứ thường xuyên hoặc cách sử dụng các thư viện của bên thứ ba để thực hiện các phân tích được tích hợp trong phần mềm Sane được thiết kế từ cơ sở để phân tích thống kê.

                Tôi đồng ý với điều này. Không chỉ là tôi cần cài đặt và yêu cầu các gói khác nhau, đó không phải là vấn đề. Vấn đề là tôi cần tìm kiếm chức năng mà tôi yêu cầu, đây là một nhiệm vụ không tầm thường. Chẳng hạn, tôi biết rằng Polca sẽ phù hợp với các mô hình lớp tiềm ẩn với các chỉ số nhị phân hoặc phân loại và nó có thể thực hiện hồi quy lớp tiềm ẩn và nó có thể thực hiện kiểm tra Bootstrap LR, nhưng nó chỉ có thể xử lý các loại chỉ số đó chứ không phải các loại khác. Flexmix là một chương trình tổng quát hơn ít nhất là tương đương với chức năng của GSEM nhưng cú pháp khó sử dụng hơn.PoLCA will fit latent class models to binary or categorical indicators, and it can do latent class regression, and it can do the bootstrap LR test, but it can only handle those types of indicators and not other types. flexmix is a more general program that's got at least the equivalent to gsem's functionality but the syntax is more challenging to use.

                Về điều đó: Các tác giả gói khác nhau sử dụng cú pháp khác nhau. Trên các lệnh Stata gốc, cú pháp có những điểm tương đồng đáng kể. Khi tôi biết Stata nói chung, tôi biết cú pháp. Cú pháp của R không đồng nhất hơn trên các gói khác nhau. Và một số trong số họ có những điều kỳ quặc khác. Ví dụ: gói MIRT của R [Phil Chalmers, Brilliant Guy] yêu cầu bạn tạo khung dữ liệu chỉ chứa các câu hỏi khi bạn phù hợp với mô hình IRT - và nếu bạn có khung dữ liệu chung, nó sẽ coi mọi thứ như một câu hỏi, bao gồm bất cứ điều gì bạn có thể coi là một đồng biến [ví dụ: tuổi, giới tính, giới tính]. Nếu bạn muốn phù hợp với bất kỳ mô hình IRT nào bằng cách sử dụng đồng biến [ví dụ: mô hình chức năng vật phẩm khác biệt, mô hình giải thích], thì bạn cần cung cấp riêng cho một vectơ hoặc khung dữ liệu chứa các đồng biến. Tôi muốn gửi email cho Chalmers và nói với anh ấy điều này làm cho mọi thứ trở nên khó khăn, nhưng anh ấy đã phát triển toàn bộ gói về cơ bản 'T Mang mình để làm điều đó.mirt package [Phil Chalmers, brilliant guy] requires you to create a data frame containing just the questions when you are fitting an IRT model - and if you have a general data frame, it's going to treat everything as a question, including anything you might consider to be a covariate [e.g. age, sex, gender]. If you want to fit any IRT model using covariates [e.g. differential item function model, explanatory model], then you need to separately supply a vector or a data frame containing the covariates. I want to email Chalmers and tell him this makes things kind of tricky, but he did develop the whole package basically for free as part of his dissertation, and he takes time out of his presumably busy day to support the package's users, so I can't bring myself to do that.

                Xin lưu ý rằng có thể rất khó để trả lời một câu hỏi mà không có dữ liệu mẫu. Bạn có thể sử dụng lệnh DataEx cho việc này. Nhập trợ giúp DataEx tại dòng lệnh.dataex command for this. Type help dataex at the command line.

                Khi trình bày mã hoặc kết quả, vui lòng sử dụng định dạng phân định mã chúng. Sử dụng nút # trên thanh công cụ định dạng, giữa "[trích dẫn kép] và các nút.

                Bình luận

              Bài Viết Liên Quan

              Chủ Đề