一键爬取社交平台视频、图片和评论,下载无水印视频,谨慎使用!

Поделиться
HTML-код
  • Опубликовано: 2 фев 2025

Комментарии • 34

  • @AIDiscovery2045
    @AIDiscovery2045  8 месяцев назад +1

    视频中提到的短视频下载网站已被污染,不推荐大家使用。

  • @bulusid
    @bulusid 9 месяцев назад

    感谢大佬分享 爱了爱了🎉

  • @爱吃椰肉
    @爱吃椰肉 5 месяцев назад

    大佬,想请问一下,我这边的视频下载链接点开后下载的视频格式有问题,之后需要更改,有没有办法让他直接下的就是视频格式?

  • @yfygs
    @yfygs 2 месяца назад

    感谢分享!请问下这个方法抓取条数受搜索结果显示限制吗?我看了下小红书网页端搜索结果大概显示200条以内,手机端显示1000条以内。

    • @AIDiscovery2045
      @AIDiscovery2045  2 месяца назад

      有限制,条数多了服务端会封IP

  • @亮歌
    @亮歌 9 месяцев назад

    大佬,请问下,要爬取哪个网站就要写对应的爬取代码吗?如果想爬取wordpress独立站的商品数据可以吗?

    • @AIDiscovery2045
      @AIDiscovery2045  9 месяцев назад

      可以,但需要自己写解析网页的代码

  • @刘籽蓉
    @刘籽蓉 8 месяцев назад

    大佬,请问为什么在进行pip install -r requirements.txt这一步的时候会出现不匹配的错误呢。ERROR: THESE PACKAGES DO NOT MATCH THE HASHES FROM THE REQUIREMENTS FILE.

    • @AIDiscovery2045
      @AIDiscovery2045  8 месяцев назад

      检查pip 源是不是连的pypi,不建议用国内的镜像;还有可能的原因是网络原因,安装过程中某些文件没下载完整损坏了

    • @刘籽蓉
      @刘籽蓉 8 месяцев назад

      @@AIDiscovery2045 非常感谢大佬的解答!应该是网络问题,我重新运行就没有出现这个问题了

  • @qdiwangwei
    @qdiwangwei 9 месяцев назад

    感谢分享。

  • @eudocia5753
    @eudocia5753 9 месяцев назад

    大佬我想问下就是首先我按照视频步骤进行操作后并未出现data文件夹,其次在config中我已经将数据存储格式改为了csv格式,但是文件却以pma格式存储在了browser data文件夹中 我想问下该怎么办

    • @AIDiscovery2045
      @AIDiscovery2045  9 месяцев назад

      browser data里只是登录信息,data文件夹里没有生成文件,说明爬取并未成功。可以删除browser data里的文件夹,尝试重新登录爬取

    • @eudocia5753
      @eudocia5753 9 месяцев назад

      @@AIDiscovery2045 我看了下cmd中显示的是bilibili crawler finished,然后我是type creator,但好像还是没有

    • @eudocia5753
      @eudocia5753 9 месяцев назад

      @@AIDiscovery2045 我试了试type search是可以的但是如果改成creator就不会生成数据

    • @AIDiscovery2045
      @AIDiscovery2045  9 месяцев назад

      @@eudocia5753 creator ID不是在search key里指定,配置文件后半部分有指定creator ID的地方

    • @eudocia5753
      @eudocia5753 9 месяцев назад

      @@AIDiscovery2045 知道了谢谢

  • @何川-m3x
    @何川-m3x 9 месяцев назад

    能否爬取其他网页的内容吗?例如,我想爬取一个网站包含特定人名的所有网页,可以操作么?

    • @AIDiscovery2045
      @AIDiscovery2045  9 месяцев назад

      这个目前只能爬取视频演示的5个社交平台内容

  • @kenlee7677
    @kenlee7677 9 месяцев назад

    大佬,在安装依赖时出现:ERROR: Could not open requirements file: [Errno 2] No such file or directory: 'requirements.txt' 如何解决?

    • @AIDiscovery2045
      @AIDiscovery2045  9 месяцев назад

      看看解压后的目录结构,是否在最终的MediaCrawler目录下执行的pip install

  • @pioneerunicorn
    @pioneerunicorn 9 месяцев назад

    重新删掉再部署输入命令python310\python.exe -m venv venv会出现系统找不到指定的路径。这是什么原因?请问怎么彻底删除?能出详细的小红书指定帖子指定ID抓取的详细操作吗?对于小白来说您的视频没有详细到每一步,有点难懂,没有提取成功,虽然都一步步按照视频操作了,没有出现data文件夹。

    • @AIDiscovery2045
      @AIDiscovery2045  9 месяцев назад +1

      不需要重新部署。部署成功后每次运行前,到安装目录下,地址栏输入cmd打开命令窗口,再输入
      call venv\scripts\activate.bat
      然后输入爬取指令即可

  • @姬氏-s6f
    @姬氏-s6f 7 месяцев назад

    大佬,苹果电脑怎么操作?能给个教程吗?

    • @AIDiscovery2045
      @AIDiscovery2045  7 месяцев назад

      没在MAC下详细测试过哈,不知道这个项目是否支持

  • @edison-f9r
    @edison-f9r 9 месяцев назад

    我爬起反js加密吗?

  • @matthewlee708
    @matthewlee708 9 месяцев назад

    很干

  • @まふろ-b9w
    @まふろ-b9w 8 месяцев назад

    美团可以吗

  • @oliverryan7927
    @oliverryan7927 9 месяцев назад

    大佬,按照你的安装方法做的,报错了 ,ModuleNotFoundError: No module named 'aiofiles'

    • @AIDiscovery2045
      @AIDiscovery2045  9 месяцев назад

      建议就用演示里的python版本,还不行就手动安装下
      pip install aiofiles

    • @oliverryan7927
      @oliverryan7927 9 месяцев назад

      @@AIDiscovery2045谢谢 我改了个参数 ,好了 aiofiles==0.8.0

  • @弘军周
    @弘军周 9 месяцев назад

    (.venv) D:\code\MediaCrawler>'playwright' 不是内部或外部命令,也不是可运行的程序
    ''playwright'' 不是内部或外部命令,也不是可运行的程序
    或批处理文件
    这个怎么办

    • @AIDiscovery2045
      @AIDiscovery2045  9 месяцев назад

      视频下方的详细说明里有每一步指令,可以复制过去执行

    • @jianmingyan8162
      @jianmingyan8162 7 месяцев назад

      @@AIDiscovery2045 File "D:\MediaCrawler-main\python310\lib\concurrent\futures\thread.py", line 58, in run
      result = self.fn(*self.args, **self.kwargs)
      UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 219: illegal multibyte sequence , 我运行Python db. py 这个指令的时候,运行出现这个错误,怎么解决