Chi tiết cách login và crawl dữ liệu từ Facebook bằng Python - Mì AI

Поделиться
HTML-код
  • Опубликовано: 25 окт 2024

Комментарии • 214

  • @dungtrung4618
    @dungtrung4618 3 года назад +8

    e nói thật video a dễ hiểu thật ý. Mong a ra nhiều video code về fb hơn để mọi người cùng học hỏi

    •  3 года назад +1

      Cảm ơn em. Anh sẽ cố gắng ra nhiều nhé!

  • @pduyet97
    @pduyet97 3 года назад +3

    đang từ took khác chuyển sang học selenium chưa biết từ đâu tự nhiên thấy video này..dễ hiểu :v..like a

    •  3 года назад +1

      Hihi thanks bạn nhiều nhiều nhé!

  • @nguyenvan1878
    @nguyenvan1878 9 месяцев назад +1

    quá tuyệt vời
    cảm ơn bạn đã chia sẽ

    •  9 месяцев назад

      Cảm ơn bạn đã ủng hộ nha. Cần thêm thì bạn post lên Nhóm "Hội anh em thích ăn Mì AI" - facebook.com/groups/miaigroup nhé!

  • @vinhngo5546
    @vinhngo5546 3 года назад +1

    video rất bổ ịch, cảm ơn anh.

    •  2 года назад

      Cảm ơn bạn.
      Cần thêm gì post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup cho tiện nha!

  • @bactran7799
    @bactran7799 3 года назад +1

    cảm ơn anh, rất chi tiết và dễ hiểu

    •  3 года назад

      Thanks bạn ủng hộ nha :D

  • @thanhnamnguyen530
    @thanhnamnguyen530 4 года назад +1

    Cảm ơn anh đã chia sẻ, anh hướng dẫn thêm phần craw data từ phần quảng cáo fb về đi ạ :))

    •  4 года назад

      Haha anh không làm ads nên ko rõ nó có khác gì với phần khác ko?

    • @thanhnamnguyen530
      @thanhnamnguyen530 4 года назад

      @ Dữ liệu quảng cáo có cả về hành vi và nhân khẩu học a ạ. Mình có thể lấy qua API , vấn đề là chưa biết lấy về thế nào
      :))

  • @KuBjn2210
    @KuBjn2210 4 года назад +2

    Hay quá anh ơi! Không biết mình có thể áp dụng cách này để nuôi nick clone facebook không a?

    •  4 года назад +1

      Hihi hoàn toàn được em :D

  •  6 месяцев назад +1

    nay em mới tình cờ xem được video của anh, nhưng hình như selenium cập nhật lại toàn bộ function rồi hay sao ấy ạ? Ví dụ như find_element_by_id

    •  6 месяцев назад

      Đúng rồi em. Giờ nó dùng chung 1 hàm find và change value type bên trong. Em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup trao đổi thêm nếu cần nhé!

  • @DucTran-gp4cm
    @DucTran-gp4cm 7 дней назад +1

    anh có thể hướng dẫn crawl tin nhắn chat trong group zalo được không ạ?

    •  6 дней назад

      Mình lại chưa làm món này. Em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup cho tiện trao đổi nhé!

  • @misachanneloffical628
    @misachanneloffical628 3 года назад +1

    Ví dụ lấy trường thông tinh tên, địa chỉ, like page từ 1 list các link fb vào cùng 1 sheet excel thì lm thế nào

    •  3 года назад

      Thì đầu tiên em mở từng link, lấy info rồi dùng lệnh write excel.
      Welcome em. Share và đăng ký kênh ủng hộ a nha!

  • @ha_nguyen_146
    @ha_nguyen_146 Год назад +1

    cháu cảm ơn chú rất nhiều ạ

    •  Год назад +1

      Yeah rất vui vì giúp được cháu nhé!

  • @VinhNguyen-lb1ux
    @VinhNguyen-lb1ux 3 года назад +1

    Hay quá bác ơi

    •  3 года назад

      Thanks bạn ủng hộ nha!

  • @PA_Offical
    @PA_Offical 2 года назад +1

    Bác Mì AI ơi thời điểm hiện tại selenium đã lỗi thời không dùng được nữa bác làm thêm bài khác hướng dẫn với

    •  2 года назад

      Úi mình vẫn hàng ngày dùng Selenium để lấy dữ liệu chứng khoán mà. Nó lỗi thời như nào thế? Bạn chia sẻ rõ hơn được không?

  • @dj_arimakousei
    @dj_arimakousei 4 месяца назад +1

    đoạn 36:00 a lấy class của một bạn Vi Huỳnh mà sao lúc in lại in dc tất cả vậy ạ, mỗi user 1 class chứ nhỉ

    •  4 месяца назад

      Em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup kèm ảnh chụp xem nhé!

  • @paolo3-nguyen
    @paolo3-nguyen 8 месяцев назад +1

    Dung implicit wait unti thay vi hard sleep 5 giay nhe ban

    •  8 месяцев назад +1

      Chuẩn bạn. Thông thường trong các dự án thực tế mình cũng hay dùng wait. Chứ đôi khi 5 giây là ko đủ để nó load ra :D

  • @duonghuy5740
    @duonghuy5740 4 месяца назад +1

    dễ hiểu, đã +1 sub cho a, cảm ơn a.

    •  4 месяца назад +1

      Cảm ơn em. Cần thêm gì cứ lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé!

  • @kytran1146
    @kytran1146 Год назад +1

    anh ơi anh nói rõ cách lấy cái "xem các bình luận trước" được k ạ em lấy mãi mà k được.

    •  Год назад

      Anh post lỗi lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup kèm ảnh chụp trao đổi cho tiện nha!

  • @longhoangngoc2829
    @longhoangngoc2829 3 года назад +1

    Anh ơi! Em muốn crawl comment xong thì đánh giá giá xem comment đấy thuộc dạng tích cực, tiêu cực hay trung tính thì anh có thể nói sơ qua cho em về cách làm không ạ?

    •  3 года назад

      Đây em
      miai.vn/2020/05/04/nlp-series-1-thu-lam-he-thong-danh-gia-san-pham-lazada/

  • @BảoQuốcTrần-t5n
    @BảoQuốcTrần-t5n Год назад +1

    Trong trường hợp đăng nhập sử dụng prompt() thì làm như thế nào a?

    •  Год назад

      Sử dụng prompt là ntn em?

  • @duonggg1481
    @duonggg1481 3 года назад +1

    hay quá chú ơi cảm ơn chú chú cho cháu hỏi là win 7 không có terminal thì làm sao ạ

    •  3 года назад

      Thì cháu dùng Command Line!

    • @duonggg1481
      @duonggg1481 3 года назад

      @ dạ chú

  • @randyluong6275
    @randyluong6275 4 года назад +2

    anh ơi, các variables như reaction (likes, heart,...) và sharing của comment có hiển thị ko a

    •  4 года назад +2

      Có hiện em ơi. Em giả lập 1 lệnh click vào nó sẽ hiện lên 1 cửa sổ mới. Trong đó có số lượng đó.

  • @hoangtuyen2000
    @hoangtuyen2000 4 года назад +1

    Tuyệt vời thầy ơi

    •  4 года назад

      Cảm ơn em nhiều!

  • @TranLamYoutube
    @TranLamYoutube Год назад +1

    Bữa giờ em vẫn đang tìm hiểu làm sao để có thể lấy danh sách bài viết trong 1 group liên tục, khi có 1 bài viết mới được cập nhật.
    nếu dùng selenium thì phải gọi lại sau mỗi 1 phút. và không thể chạy trên 1 server free như render...
    Cho em hỏi có hướng nào giải quyết không ạ?

    •  Год назад

      Em post lên nhóm Mì AI xem nhé!

  • @hoangatduong836
    @hoangatduong836 2 года назад +1

    Chào anh, cho em hỏi anh đang code trên phần mềm gì vậy ?

    •  2 года назад

      Anh sử dụng Pycharm nhé.

  • @cuocsongmuonmau6952
    @cuocsongmuonmau6952 3 года назад +1

    E làm với trang web có bắt điền thêm captcha thì làm sao tự động điền captcha được a nhỉ ?

    •  3 года назад

      Khoai đó em. Em post lên Group: facebook.com/groups/miaigroup trao đổi thêm nhé!

  • @tralevan6039
    @tralevan6039 3 года назад +1

    admin ơi e thực hiện câu lênh browser = webdriver. .. trong windows không hiện các thuộc tính như Chrom, firefox hay một số web khác thì sửa lỗi ntn admin. mong admin chỉ e với ạ

    •  2 года назад

      Bạn post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup kèm ảnh lỗi cho tiện nha!

  • @leelucky6390
    @leelucky6390 4 года назад +1

    anh ơi em muốn hỏi có một số bình luận rất dài và phải bấm vào xem thêm thì mình nên chỉnh vòng lặp như nào để lấy được hết nội dung bình luận ạ?

    •  4 года назад +1

      Em cứ kiểm tra các bình luận, nếu có thêm nút xem thêm thì ta bấm vào

    • @leelucky6390
      @leelucky6390 4 года назад

      @ dạ vâng em tìm đc cách giải quyết r ạ hề hề

  • @danhtrinh3521
    @danhtrinh3521 3 года назад +1

    anh ơi, cho em hỏi là thẻ

    •  3 года назад

      Em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup trao đổi cho tiện nhé!

  • @mystic837
    @mystic837 3 года назад +1

    Quá hay

    •  3 года назад

      Thanks bạn ủng hộ nha.
      Gia nhập cộng đồng Mì AI nha!
      Fanpage: facebook.com/miaiblog
      Group: facebook.com/groups/miaigroup
      Website: miai.vn
      RUclips: bit.ly/miaiyoutube

  • @kinghung688
    @kinghung688 2 года назад +1

    anh ơi em đá cài chromedriver.exe và code theo trong video sao no vẫn hiện là ko tìm đc file mong anh giải đáp, em cảm ơn

    •  2 года назад

      Em post cụ thể lên facebook.com/groups/miaigroup cho tiện trao đổi nhé!

  • @quyetvan6081
    @quyetvan6081 6 месяцев назад +1

    nếu quá trình làm bị lỗi như thế này ( TypeError: 'module' object is not callable ) thì phải xử lý thế nào ạ, mong anh rep

    •  6 месяцев назад

      Bạn post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup kèm ảnh chụp cho tiện trao đổi nhé!

  • @checkmate8811
    @checkmate8811 4 года назад +2

    Anh ơi hình như FB đổi cách viết HTML rồi, em copy nguyên code của a chạy thử mà không crawl được nữa, anh có thể làm một video crawl mới được không ạ

    •  4 года назад

      Facebook đã đổi giao diện. Nên có thể ko chạy đc đâu. Em phỉa viết lại code nhé

    • @solairenero5023
      @solairenero5023 4 года назад

      alo bh bạn chạy được chưa ạ

    • @kaitoukuroba301
      @kaitoukuroba301 2 года назад +1

      @ em có viết lại code nhưng vẫn dính lỗi no such element, em thử khá nhiều dòng quanh quanh chỗ click bình luận nhưng vẫn không được ạ :( anh có gợi ý nào về dòng HTML có thể find_element không ạ?

    •  2 года назад

      @@kaitoukuroba301 em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé

  • @ЗюиЧанДык
    @ЗюиЧанДык 4 года назад +1

    Bác ơi con không tải được chrome drive 64 bit cho máy win, con cần làm gì hả Bác?

    •  4 года назад

      Con tải thì bị lỗi như nào? Con chụp màn hình post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup
      nhé!

  • @phucuongle7986
    @phucuongle7986 4 года назад +1

    Sử dụng selenium chỉ mở được hồ sơ khách thôi à anh, có cách nào mở được chrome hồ sơ 2 không anh
    options.add_argument("user-data-dir=C:\\Users\\Users_Name\\AppData\\Local\\Google\\Chrome\\User Data\\Profile 2") - Cái này trên mạng thấy có hướng dẫn nhưng làm thì chạy không ra

    •  4 года назад

      Cái này em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup để trao đổi cho tiện nha!

    • @Cun-qv9xk
      @Cun-qv9xk 4 года назад +1

      Mình cũng cần mở hồ sơ sign in sẵn 1 số account google sau đó vào 1 trang web thực hiện 1 số thao tác giống nhau, bạn đã tìm được giải pháp chưa @Phú Cường Lê

  • @phattran6028
    @phattran6028 3 года назад +1

    anh ơi có cài hàm nào mà khi crawl dữ liệu mà ẩn chrome anh, e cảm ơn

    •  3 года назад

      Có em. Em search headless seleinum python! Hoặc post lên Group: facebook.com/groups/miaigroup trao đổi thêm cho rõ nhé!

  • @Caovannguyen
    @Caovannguyen 2 года назад +1

    cảm ơn anh

    •  2 года назад

      Thanks bạn đã ủng hộ hihi.
      Cần thêm gì bạn post lên facebook.com/groups/miaigroup nhé!

  • @luanoanvan9368
    @luanoanvan9368 2 года назад +1

    anh ơi với thư viện selenium hiện tại của em thì chỉ có find_element và find_elements chứ không có find_element_by_xpath thì làm sao ạ. em cảm ơn anh ạ

    •  2 года назад

      Phiên bản mới nó vạy em. Em thay find_element_by_xpath = find_element(by="xpath) nhé. Cần thêm gì em post lên facebook.com/groups/miaigroup nhé!

  • @nguyenphan9494
    @nguyenphan9494 3 года назад +1

    Anh ơi, em đang làm bài toán về phân tích câu comment là tốt hay xấu anh cho em xin hướng dẫn được không ạ. Em cảm ơn ạ

    •  3 года назад +1

      Đây em
      www.miai.vn/2020/05/04/nlp-series-1-thu-lam-he-thong-danh-gia-san-pham-lazada/
      Cần hỗ trợ gì em lên Group: facebook.com/groups/miaigroup hỏi thêm nha!

    • @nguyenphan9494
      @nguyenphan9494 3 года назад +1

      @ Anh cho em xin hướng dẫn chạy project được không ạ. Em cảm ơn ạ

    •  3 года назад +1

      @@nguyenphan9494 Ủa cả 1 bài hướng dẫn rồi mà em.

  • @minh96truong72
    @minh96truong72 3 года назад +1

    cho em hỏi là làm sao để không dùng delay mà dòng code sau vẫn đợi dòng code trước load xong ạ.

    •  3 года назад +1

      Bạn dùng lệnh WaitFor của Selenium nhé!

  • @TiMaclife
    @TiMaclife 3 года назад +1

    cho em hỏi, vậy nếu cmt đó có nhãn dán và hình ảnh thì phải làm sao ạ?

    •  3 года назад

      Ý em là sao nhỉ?

  • @Donghung_Saigon
    @Donghung_Saigon 3 года назад +1

    video rất hay. cảm ơn anh nhé

    •  3 года назад

      Welcome em nha!
      #MìAI
      Fanpage: facebook.com/miaiblog
      Group trao đổi, chia sẻ: facebook.com/groups/miaigroup
      Blog: miai.vn
      RUclips: ruclips.net/user/MiAIblog

  • @NguyenHung-ep2zk
    @NguyenHung-ep2zk 4 года назад +1

    cảm ơn anh nhiều!

    •  4 года назад

      Không có gì em. Cảm ơn em nhé.
      #MìAI
      Fanpage: facebook.com/miaiblog
      Group trao đổi, chia sẻ: facebook.com/groups/miaigroup
      Blog: miai.vn
      RUclips: bit.ly/miai_youtube

  • @duymanh5506
    @duymanh5506 3 года назад +1

    anh ơi, làm sao để ghi text vào chỗ tin nhắn ở trong messenger vậy ạ, không có id ở trong html nên e không biết chèn text vào kiểu gì :((

    •  3 года назад

      Em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup thảo luận cho tiện nha!

  • @tienmanh1485
    @tienmanh1485 3 года назад +1

    cho em hỏi mình muốn save full trang html về luôn làm sao vậy anh

    •  3 года назад

      Thế thì sau khi get xong em in luôn cái element.get_attribute('innerHTML') là okie. Hoặc em chơi luôn thư viện khác cho nhanh cũng được
      import urllib2
      page = urllib2.urlopen('stackoverflow.com')
      page_content = page.read()
      with open('page_content.html', 'w') as fid:
      fid.write(page_content)

  • @learningisfun5353
    @learningisfun5353 3 года назад +1

    hay quá a ạ

    •  3 года назад +1

      Cảm ơn em rất nhiều!

  • @vutruonguc8061
    @vutruonguc8061 4 года назад

    hay quá anh ơi, cảm ơn anh

    •  4 года назад +2

      Yeah cảm ơn em ủng hộ nha!

  • @tranminhthien9896
    @tranminhthien9896 3 года назад +1

    sau khi đăng nhập thành công facebook sẽ ra một bản thông báo ...làm sao tắt được vậy anh?

    •  3 года назад

      Thông báo gì thế em? Em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup thảo luận cho tiện nhé!

  • @checkmate8811
    @checkmate8811 4 года назад +1

    Anh ơi có cách nào để crawl được data về comment trên tiki không ạ

    •  4 года назад

      Có em. Em cứ inspect từng thành phần xem nó có id là gì, class ra sao là lấy được hết.

  • @nguyenthinh6842
    @nguyenthinh6842 3 года назад +1

    Thầy ơi cho nó kéo chuột xem hết trang như nào ạ

    •  3 года назад

      Bạn post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé. Trao đổi cho tiện!

  • @hahoa8177
    @hahoa8177 3 года назад +1

    Lưu đăng nhập kiểu gì ạ

    •  3 года назад

      Em có thể save lại user/pass. Còn muốn lưu đăng nhập thì có thể save cả cookies.

  • @agriculturelifescience7938
    @agriculturelifescience7938 3 года назад +1

    Anh lấy . Các bài đăng từ nhóm xuống được ko anh. Vì gruop em bị chiếm quyền adimin

    •  3 года назад

      A ko hiểu ý em . Em post lên Group: facebook.com/groups/miaigroup trao đổi thêm nhé!

  • @truongminhman517
    @truongminhman517 2 года назад +1

    anh ơi, lúc run em bị lỗi ImportError: No module named selenium. Em tải python3, pip22, selenium rồi, dùng pip3 show selenium cũng ra version luôn mà sao nó lại không có module. Mong anh chỉ giáo ạ, em cảm ơn.

    •  2 года назад +1

      Em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup kèm ảnh cho tiện trao đổi nhé!

  • @ThanhNguyen-cw6qz
    @ThanhNguyen-cw6qz 3 года назад +1

    Anh ơi, nếu em muốn crawl danh sách thành viên của group facebook thì em nên sử dụng công cụ nào ạ ?

    •  3 года назад

      Vẫn selenium và python thôi em.

  • @caotrungkien_3098
    @caotrungkien_3098 2 года назад

    anh ơi cho em hỏi nếu mình muốn crawl ảnh về thì dùng hàm gì ạ. Em cảm ơn anh!

    •  2 года назад

      Em lấy URL của ảnh rồi save về thôi. Cần thêm gì em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé!

  • @phanthanhduyen
    @phanthanhduyen 4 года назад +2

    em chạy browser.find_elements_by_xpath("//div[@aria-label='Bình luận']") nhưng mà kết quả là 1 list rỗng thì phải sửa làm sao đây ạ, các bước trước thì em chắc chắn đúng hết rồi

    •  4 года назад

      Facebook đổi giao diện rồi thì phải em. Em inspect lại đi!

    • @phanthanhduyen
      @phanthanhduyen 4 года назад +1

      @ em chạy trên local thì được, chạy trên colab thì không được ạ

    •  4 года назад

      @@phanthanhduyen Cái này chạy local đi em:D. Train model thì hãy colab ":D

    • @phanthanhduyen
      @phanthanhduyen 4 года назад +1

      @ thanks a

    • @solairenero5023
      @solairenero5023 4 года назад

      @@phanthanhduyen alo bạn chạy dc chưa ạ

  • @thanhtrungnguyen415
    @thanhtrungnguyen415 3 месяца назад +1

    Dùng selenium này có sợ bị ban nick ko bác

    •  3 месяца назад

      Có đó bác. Phải kết hợp với Proxy cho lành! Em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup cho tiện trao đổi nhé!

  • @nguyentanloc9023
    @nguyentanloc9023 3 года назад +2

    Hi Anh ơi, cho em hỏi thăm ạ, em cũng mới bắt đầu học rawl dữ liệu thôi, 1 web nội bộ chứa thông tin dữ liệu trực tuyến html dạng table. Nội từng cell là từng Khách hàng với khoảng 10 cột chứa thông tin. Tập load khoảng 104 nghìn cell khách hàng. Em chưa làm, nhưng nếu làm bằng phương pháp selenium này liệu có load đc 1 lượng dữ liệu lớn như vậy ko ạ. em cảm ơn Anh.

    •  3 года назад +1

      Nếu web hiển thị được 104K cell và Chrome ko treo thì Sele lấy tốt em nhé!

    • @nguyentanloc9023
      @nguyentanloc9023 3 года назад

      @ dạ Anh, em dùng chrome web cty em chỉ load đc 1 lần có 200 thôi Anh :(

    • @rawmetal3052
      @rawmetal3052 2 года назад +1

      @@nguyentanloc9023 bạn định vị bằng XPATH hay CSS selector? Khi crawl dữ liệu thứ tự ưu tiên khi định vị element như sau:
      1. id
      2. class name
      3. css selector
      và cuối cùng khi hết lựa chọn: XPATH do cần phải chỉnh cho driver đến tọa độ của element.
      Nếu crawl bằng CSS selector thì miễn là dữ liệu hiển thị toàn bộ dưới dạng HTML trên 1 trang thì load một phát là được tất ngay

    • @holuc4630
      @holuc4630 2 года назад

      cho mình hỏi khi mình muốn click next page của một trang thì phải cuộn tới chỗ hiện thị nextpage thì nó mới chạy nhỉ.

    • @holuc4630
      @holuc4630 2 года назад

      @@rawmetal3052 cho mình hỏi khi mình muốn click next page của một trang thì phải cuộn tới chỗ hiện thị nextpage thì nó mới chạy nhỉ.

  • @duyhoangta7988
    @duyhoangta7988 3 года назад +1

    Thưa a hình như bây h facebook họ đổi giao diện mới mình không thể lấy được element như cách này được thì phải ạ, anh có thể hỗ trợ e cách lấy mới được k ạ?

    •  3 года назад +2

      Đúng rồi em. Sau khi anh làm clip thì Facebook thay đổi. Em click chuột phải rồi chọn Inspect để lấy XPath của element nhé.

    • @duyhoangta7988
      @duyhoangta7988 3 года назад +1

      @ Okie A Ạ. Chúc a sức khỏe, giữ nhiệt huyết để chia sẻ kiến thức a nhá

    •  3 года назад

      @@duyhoangta7988 Welcome em!

  • @vanhau8570
    @vanhau8570 4 года назад +1

    Dạ anh ơi cho em hỏi chỗ lệnh comment.find_element_by_class_name("") . Nếu em dùng phiên bản facebook cũ thì vẫn được bình thường còn khi facebook phiên bản mới em tìm không ra name class với id của comment để bỏ vào á anh @@

    •  4 года назад

      Em phải inspect xem trên phiên bản mới thì class_name là gì rồi thay vào chỗ lệnh find là okie.

    • @vanhau8570
      @vanhau8570 4 года назад

      Mì AI dạ e thử rồi anh.. mà e thay class name vào nó chỉ lấy dc comment đầu tiên thôi á a.. e cũng thử dùng find by class name hay xpath thẻ div nó cũng chỉ show comment đầu tiên thôi á a 🧐🧐

  • @vanson9114
    @vanson9114 3 года назад +1

    Anh ơi cho em hỏi là có cách nào điểu khiển chrome mà không cần thông qua selenium không ạ? E tìm hiểu mà không thấy

    •  3 года назад

      Ủa thế sao em ko dùng Selenium?

    • @vanson9114
      @vanson9114 3 года назад +1

      @ Selenium mỗi khi chạy lại mở 1 chromedriver mới. Mà e muốn điều khiển dữ liệu trên chính chrome đang chạy luôn ạ

    •  3 года назад +1

      @@vanson9114 Cách nhanh nhất là em xem chrome hiện tại đang mở tab gì em mở lại bên Sele cho nhanh

    • @vanson9114
      @vanson9114 3 года назад

      @ À. Để e search thử ạ. E cảm ơn ad nhiều nhé. 😂😂😂

  • @trunghieu5194
    @trunghieu5194 2 года назад +1

    anh ơi sao em chạy sleep nó ko hoạt động mà nó đóng trình duyệt luôn

    •  2 года назад

      Em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé! Trao đổi cho tiện!

  • @nguyenhoanggiahuy6596
    @nguyenhoanggiahuy6596 3 месяца назад +1

    ah ơi h selenium 4.22 gọi lệnh sao ạ

    •  3 месяца назад

      Lâu quá a cũng ko làm. Em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé!

  • @YouGG
    @YouGG 3 года назад +1

    a ơi, e sử dụng facebook lite rồi, 11:57 mà nó ko điền thông tin ak

    •  3 года назад

      Em chụp màn hình up lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup
      xem nhé!

  • @cosmic12333
    @cosmic12333 2 года назад +1

    cách này có crawl được phim không ạ

    •  2 года назад

      Gì cũng được em. Miễn tìm ra elements và có cách vượt chặn (nếu site chặn) thì okie hết.

    • @cosmic12333
      @cosmic12333 2 года назад

      @ em cảm ơn ạ

  • @tuananhnguyen7381
    @tuananhnguyen7381 3 года назад +1

    Anh ơi anh có cách nào bypass captcha không anh

    •  3 года назад

      món này phải train model OCR hoặc dùng dịch vụ thuê ngoài qua API em ah.

  • @GigaOhms
    @GigaOhms 4 года назад +1

    anh ơi, anh làm hướng dẫn cách ghi vào file excel luôn được không ạ

    •  4 года назад +2

      Sắp tới anh làm khóa về Python nhé!

    • @ai6503
      @ai6503 4 года назад +1

      Mình cũng đang cần cái này, mong anh Mì AI hướng dẫn làm sớm

    •  4 года назад +1

      @@ai6503 Thanks bạn. Trong khóa học Python (hiện đã có bài đầu tiên trên Kênh RUclips) mình sẽ trình bày ở Chương 5 nhé!

  • @quanbluee
    @quanbluee 3 года назад +1

    a ơi tại sao e lấy tất cả element theo xpath là tất cả thẻ div có class là ''bp9cbjyn ue3kfks5 pw54ja7n uo3d90p7 l82x9zwi n1f8r23x rq0escxv j83agx80 bi6gxh9e discj3wi hv4rvrfc ihqw7lf3 dati1w0a gfomwglr'' khi chạy thì lúc nó lấy được list lúc thì k ạ, e có check là mấy lần không lấy được list thì class nó cũng tên vậy luôn chứ k đổi

    •  3 года назад +1

      Facebook nó có hệ thống class khá động đậy. Mình phỉa dùng tip tý em ah. Em post thử vấn đề lên facebook.com/groups/miaigroup xem! Có ảnh chụp cho tiện!

    • @quanbluee
      @quanbluee 3 года назад +1

      @ e ms xử lý được vấn đề đó r ạ, do lúc chạy e k set tgian sleep để fb nó load page nên ms bị v ạ

    •  3 года назад

      @@quanbluee Great em!

    • @tuanduong7513
      @tuanduong7513 3 года назад

      @ dùng tip gì anh nhỉ, a có thể nói rõ hơn không anh nhỉ. Em cảm ơn.

  • @uhntgs
    @uhntgs 4 года назад +1

    em cảm ơn anh

    •  4 года назад

      Yeah ko có gì em. Cảm ơn em luôn ủng hộ.
      #MìAI
      Fanpage: facebook.com/miaiblog
      Group trao đổi, chia sẻ: facebook.com/groups/miaigroup
      Blog: miai.vn
      RUclips: bit.ly/miai_youtube

  • @YuGiOh97
    @YuGiOh97 3 года назад +1

    anh ơi nếu em crawl 1 website mà content nó sử dụng lazyload thì sao ạ

    •  3 года назад

      Em dùng selenium kết hợp với waitFor là okie.
      Cần gì em lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup thảo luận thêm nha!

  • @hoangtuyen2000
    @hoangtuyen2000 4 года назад

    Mấy cái file và tài liệu tiếng anh thầy tham khảo ở đâu vậy ạ có thể cho em xin link tiếng anh không ạ

    •  4 года назад +1

      Ủa cụ thể là file và tài liệu nào nhỉ?

    • @joeywang2024
      @joeywang2024 3 года назад +1

      Tiếng Anh thì đọc ebook Web Scraping with Python. Có cả Selenium, BeautySoup...
      Tuy nhiên là nghiên cứu riêng từng cái trước.

  • @ThaoPhuong-wy7dz
    @ThaoPhuong-wy7dz Год назад

    cách này có crawl được dữ liệu người đăng kí một kênh yt bất kì k a

    •  Год назад

      Nếu cứ cái gì hiện lên trên web là mình crawl được bạn ạ :D

  • @hatrungtin274
    @hatrungtin274 4 года назад

    anh cho em hỏi phần mềm anh dùng từ 5:23 là phần mềm nào ạ anh
    mà tải cho window ntn ạ
    em cảm ơn anh ạ

    •  4 года назад +1

      Anh dùng Pycharm em. Cái này free em có thể google tải về vô tư.

    • @hatrungtin274
      @hatrungtin274 4 года назад

      Em cảm ơn ạ =))

  • @hotboy967
    @hotboy967 2 года назад +1

    login va crawl du lieu tu facebook python

    •  2 года назад

      Cảm ơn bạn.
      #MìAI
      Fanpage: facebook.com/miaiblog
      Group trao đổi, chia sẻ: facebook.com/groups/miaigroup
      Blog: miai.vn
      RUclips: ruclips.net/user/MiAIblog

  • @hieuvu6543
    @hieuvu6543 2 года назад

    anh cho e hỏi e build source anh bị lỗi như này, e làm như nào ạ lỗi chỗ find_element_by_xpath

    •  2 года назад

      Như nào em? Em post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup kèm ảnh chụp cho tiện trao đổi nhé.

  • @tungnguyen9336
    @tungnguyen9336 4 года назад

    cam on anh

    •  4 года назад

      Cảm ơn em luôn ủng hộ nha!

  • @GigaOhms
    @GigaOhms 4 года назад

    anh oi. cái dòng cmt_list = browser.find_element_by_xpath("//div[@aria-label='Bình luận']"). cái xpath đó mình lấy ở đâu vậy anh

    •  4 года назад

      Ah cái đó em làm như trong clip đó, click chuột phải chọn Copy XPath đó.

  • @snowmankhampha
    @snowmankhampha 4 года назад

    Anh ơi nếu mình viết trên điện thoại thì chomer lấy đâu ra vậy anh

    •  4 года назад

      Điện thoại thì anh sợ phải làm cách khác. Em làm bài toán gì thế. Chia sẻ lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé!

    • @joeywang2024
      @joeywang2024 3 года назад

      Điện thoại thì dùng cái khác như Safari driver...

  • @linhnguyenvu4241
    @linhnguyenvu4241 3 года назад +1

    anh ơi em cho chạy nhiều lần khiến facebook chặn phải đăng nhập thì phải xử lý thế nào vậy anh

    •  3 года назад +1

      Em đổi IP khác thôi. Và máy khác càng tốt. Facebook nó chống crawl mà!

    • @linhnguyenvu4241
      @linhnguyenvu4241 3 года назад

      @ em cảm ơn anh

    • @linhnguyenvu4241
      @linhnguyenvu4241 3 года назад

      em mò đổi IP rồi AI của thằng facebook bữa này mạnh quá

    • @linhnguyenvu4241
      @linhnguyenvu4241 3 года назад

      @ em đổi ip rồi nhưng thằng facebook nó cũng biết nên em đăng nhập luôn

  • @YouGG
    @YouGG 3 года назад +1

    Nếu như e xài Cốc cốc thì s ak 6:56

    •  3 года назад

      Thì em cài thêm Chrome để crawl nhé!

  • @nhaathoangat9575
    @nhaathoangat9575 Год назад

    from selenium import webdriver
    nó toàn báo lỗi thế này: ModuleNotFoundError: No module named 'selenium'

    • @nhaathoangat9575
      @nhaathoangat9575 Год назад

      cao nhân nào chỉ giáo e với

    •  Год назад

      Bạn post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé cho tiện trao đổi!

  • @-googlesearchdeveloper7069
    @-googlesearchdeveloper7069 4 года назад

    anh ơi trong trường hợp chỉ dc login bằng gmail thì lm sao anh, cho em keyword với :3

    •  4 года назад +1

      Login gmail thì cũng như facebook thôi. Chỉ cần điền đủ là okie? Hay ý em là gmail chặn :D

  • @ThaoNguyen-mt4qg
    @ThaoNguyen-mt4qg 3 года назад +1

    Cái này có bị toang fb k a ơi

    •  3 года назад

      Bạn làm với request rate vừa vừa thì ko sao. Còn nếu làm nhiều (ko phải để học mà làm dự án) thì phải áp nhiều chiêu khác như proxy chẳng hạn.

    • @tuantranvan8807
      @tuantranvan8807 3 года назад +1

      @ chỉ em với ạ

    •  3 года назад

      @@tuantranvan8807 Bạn post lên Group: facebook.com/groups/miaigroup trao đổi cho tiện nhé!

  • @SieuNhanKobe
    @SieuNhanKobe 3 года назад

    em bị lỗi ở chỗ dùng random.randint :< google hoài không ra hihu

    •  3 года назад

      Em post lỗi lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé

  • @tri_ho
    @tri_ho 4 года назад +1

    Thít mì dạng này

    •  4 года назад

      Thanks bạn đã ủng hộ.
      #MìAI
      Fanpage: facebook.com/miaiblog
      Group trao đổi, chia sẻ: facebook.com/groups/miaigroup
      Blog: miai.vn
      RUclips: bit.ly/miai_youtube

  • @phantinh1803
    @phantinh1803 Год назад +1

    sao em làm như anh bị lỗi anh nhỉ

    •  Год назад

      Em post lỗi lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé!

  • @thihaui
    @thihaui 4 года назад +1

    Anh ơi, e đang sử dụng Windown 64bit, nhưng trên web download chỉ có bản chrome 32 bit thôi ạ. Khi dung py gọi chrome ra thì nó báo lỗi "TypeError: 'module' object is not callable
    "

    •  4 года назад

      Không sao đâu em. Em post thửu ảnh lỗi lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé!

  • @uhntgs
    @uhntgs 4 года назад +1

    anh ơi,anh có thể hướng dẫn cách lấy link fb của người cmt rồi lấy thông tin tuổi tác,giới tính được không ạ

    •  4 года назад

      Ah cái đó thì anh lại ko rõ vì chưa mần. Em hỏi thử trên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup xem!

  • @Yuu-jf4nl
    @Yuu-jf4nl 3 года назад +1

    SO usefui