大家都在搜:

python SEO 快排 SEO工具

当前位置：淡墨SEO首页 > SEO软件 > flask-celery异步执行sitemap任务并生成文件

flask-celery异步执行sitemap任务并生成文件

淡墨SEO4年前 (2022-09-05)SEO软件12680

此次主要是将python生成的sitemap文件，转入到flask做出的api接口上，这样每次进行api请求就可以获取到网站的所有的url并生成sitemap文件。首先看看运行效果。

本地地址请求接口url：http://127.0.0.1:5100/sitemap?site=http://www.seoyiwu.com

运行命令：

1、宝塔服务器开启redis服务(安装一下redis就行了)

2、启动celery异步执行任务命令 : celery --app=run.celery worker -P eventlet -l INFO

3、启动flask命令 python run.py

接下来用postman进行测试看看。可以看到返回一个任务id，这个任务id代表任务执行的状态，是否执行完毕

如果没有执行完毕则返回当前执行步骤

执行完毕后，就会返回执行终止状态以及返回了sitemap文件

然后我们在当前目录可以看到生成的sitemap文件，可以看到已经生成成功。

好了，接下来看看代码的实现流程：

一、flask创建任务，成功celery实例

创建celery队形，并配置好redis数据库

二、sitemap任务

这是celery异步执行的任务，放到一个方法里。

@celery.task(bind=True)
def proSitemap(self,urls):
    allUrls = set()
    rootUrl = urls[0]
    while True:
        with ThreadPoolExecutor(max_workers=10) as executor:
            urls = executor.map(getsitemap_url,urls)
            urls = [url for url in urls if url][0]
        urls = set(urls) - allUrls
        if not urls:break
        for url in urls:
            if url.find(rootUrl) == -1:continue
            allUrls.add(url)
            self.update_state(state='PROGRESS',meta={'status':f'正在抓取的url: {url}'})
        urls = list(urls)
       
    allUrls = sorted(list(allUrls),key=lambda url:len(url))
    print(allUrls)
    return {'rootUrl':rootUrl,'allUrls':allUrls,'status':200,'result':'生成完毕'}

三、请求接口

配置好请求接口，生成sitemap任务运行api

@app.route('/sitemap', methods=['GET'])
def sitemap():
    site = request.args.get('site','')
    urls = [site]
    task = proSitemap.apply_async(args=[urls])
    print(task.id)
    return jsonify({
        'Location':request.host_url  + url_for('taskstatus',task_id=task.id).replace('/status','status')
    })
       

@app.route('/status/<task_id>')
def taskstatus(task_id):
    task = proSitemap.AsyncResult(task_id)
    if task.state == 'PENDING':
        response = {
            'state':task.state,
            'status':'pending'
        }
    elif task.state != 'FAILURE':
        rootUrl = task.info.get('rootUrl',0)
        allUrls = task.info.get('allUrls',1)
       
        response = {
        'state':task.state,
        'status':task.info.get('status',100),
        'rootUrl':rootUrl,#rootUrl,
        'allUrls':allUrls,#allUrls,
    }
        if 'result' in task.info:
            makeSitemap(rootUrl,allUrls)
            response['result'] = task.info['result']
    else:
        response = {
            'state':task.state,
            'status':str(task.info)
        }
    return jsonify(response)

四、生成sitemap文件

def makeSitemap(rootUrl,allUrls):
    fw = open('sitemap.xml', 'w', encoding="utf-8")
    fw.write('<?xml version="1.0" encoding="UTF-8"?>')
    fw.write(
        '\n<urlset xmlns="http://video.sitemaps.org/schemas/sitemap/0.9">'
    )
    for url in allUrls:
        fw.write('\n\t<url>')
        fw.write('\n\t\t<loc>' + url + '</loc>')
        fw.write("\n\t\t<lastmod>" +time.strftime('%Y-%m-%d', time.localtime(time.time())) +
            "</lastmod>")
        fw.write('\n\t\t<changefreq>daily</changefreq>')
        if re.findall(rootUrl + "$", url) or re.findall(
                rootUrl + "/$", url):
            fw.write('\n\t\t<priority>1.0</priority>')
        elif re.findall(rootUrl + "[^/]*/$",
                        url) or re.findall(
                            rootUrl + "/[^/]*/$", url):
            fw.write('\n\t\t<priority>0.8</priority>')
        elif re.findall(rootUrl + "[^/]*/[^/]*$",
                        url) or re.findall(
                            rootUrl + "/[^/]*/[^/]*$", url):
            fw.write('\n\t\t<priority>0.6</priority>')
        else:
            fw.write('\n\t\t<priority>0.4</priority>')

        fw.write('\n\t</url>')
    fw.write('\n</urlset>')

整体的核心步骤就这些了，接下来我们就可以将代码上传到服务器中，然后就可以在服务器调用，方便随意使用，也可以在服务器里开启一个定时任务进行定时更新sitemap文件。如果需要生成sitemap的朋友，可以私信我，获取免费接口生成！

扫描二维码推送手机访问

文章内容均为原创，禁止转载！

本文链接：http://www.danmoseo.com/news/13.html

标签: sitemap生成 celery flask

分享给朋友：

返回列表

上一篇：api内容智能伪原创并保存到mongodb中

下一篇：js逆向百度旋转验证码并通过验证

多线程发包模拟点击软件界面运行

前段时间写了一个模拟点击源码，以及网页系统的对接。在运行方面需要先安装python环境以及搭建网页和数据库，方可进行运行。这种方式比较复杂，不适合个人去使用，这次主要是做了一个qt软件，将源码进行封装，这样我们就不需要安装环境了，直接一键运行即可。下面是软件的简单界面，纯属个人简单设计（高手路过）在...

搜狗站长平台推送，站点和非站点都可提交

日常做网站seo的时候，离不开对url的推送，这也是对应站长平台提供的链接提交服务，本次就搜狗站长平台批量提交，做一个推送讲解和示例。封装软件发货传送门》》搜狗站长平台推送视频演示：如下图就是网页推送的界面，如果每次都要手动去输入提交，想必效率和耐心都跟不上，而且想要做到批量提交，肯定要借助一个开发...

多进程线程查询关键词排名，速度达到1秒10个！

python多线程有两种，一种是多进程，另一种是多线程，对于线程基础知识层面，线程运行在进程中，一个进程可以有多个线程，而多线程只能在一个进程中运行。所以在多线程并发运行的同时，开启多进程进行并行操作。这样就可以最大化的利用计算机cpu的内核。需要源码的可以在我的商城获取>>>百度...

摆渡模拟点击关键词排名优化介绍

模拟点击的原理在于模拟用户打开浏览器，搜索关键词，后面进行一系列的模拟行为操作。在python代码中，用到的浏览器框架是selenium库，然后进行模拟点击整个过程的代码执行。源码商城》》》摆渡快排软件含源码教程视频演示：本次代码已经进行封包了，在运行的时候，只需要一键运行即可在安装方面导入数据库就...

360识别文字验证码后并进行批量提交

前面说到360点选验证码js逆向的过程，这次对js逆向的过程进行实际应用并进行url的批量提交，下面讲解一下主要难点。软件拍下自动发货地址：http://faka.danmoseo.com/buy/7视频演示问题一、网页图片尺寸是320*198，而通过请求接口获取的图片尺寸是580*410那么在代码...