關(guān)鍵詞抽取和文本摘要(抽取式)
關(guān)鍵詞抽取和文本摘要服務(wù)基于textrank算法,適用于針對文檔抽取關(guān)鍵詞或者摘要。
本服務(wù)由NLP自學(xué)習(xí)平臺(tái)提供,直接調(diào)用API即可使用。
服務(wù)開通與資源包購買
使用前,請確認(rèn)是否已經(jīng)開通服務(wù),開通后可購買資源包。
服務(wù)調(diào)用與調(diào)試
模型調(diào)用文檔參考:模型調(diào)用
SDK示例文檔參考:SDK示例
調(diào)試
您可以在OpenAPI開發(fā)者門戶中直接運(yùn)行該接口,免去您計(jì)算簽名的困擾。運(yùn)行成功后,OpenAPI開發(fā)者門戶可以自動(dòng)生成SDK代碼示例。
通過環(huán)境變量配置訪問憑證(AKSK)
說明:
阿里云賬號(hào)AccessKey擁有所有API的訪問權(quán)限,風(fēng)險(xiǎn)很高。強(qiáng)烈建議您創(chuàng)建并使用RAM用戶進(jìn)行API訪問或日常運(yùn)維,請登錄RAM控制臺(tái)創(chuàng)建RAM用戶。
強(qiáng)烈建議不要把AccessKey和AccessKeySecret保存到代碼里,會(huì)存在密鑰泄露風(fēng)險(xiǎn),在此提供通過配置環(huán)境變量的方式來保存和訪問aksk
Linux和macOS系統(tǒng)配置方法
export NLP_AK_ENV=<ACCESS_KEY_ID> export NLP_SK_ENV=<ACCESS_KEY_SECRET>
其中<ACCESS_KEY_ID>替換為已準(zhǔn)備好的AccessKey ID,<access_key_secret>替換為AccessKey Secret,AccessKey ID和AccessKey Secret的獲取方式見步驟二:獲取賬號(hào)的AccessKey
Windows系統(tǒng)配置方法
新建環(huán)境變量文件,添加環(huán)境變量
NLP_AK_ENV
和NLP_SK_ENV
,并寫入已準(zhǔn)備好的AccessKey ID和AccessKey Secret。重啟Windows系統(tǒng)。
Java代碼示例
/**
* 阿里云賬號(hào)AccessKey擁有所有API的訪問權(quán)限,風(fēng)險(xiǎn)很高。強(qiáng)烈建議您創(chuàng)建并使用RAM用戶進(jìn)行API訪問或日常運(yùn)維,請登錄RAM控制臺(tái)創(chuàng)建RAM用戶。
* 此處以把AccessKey和AccessKeySecret保存在環(huán)境變量為例說明。您也可以根據(jù)業(yè)務(wù)需要,保存到配置文件里。
* 強(qiáng)烈建議不要把AccessKey和AccessKeySecret保存到代碼里,會(huì)存在密鑰泄漏風(fēng)險(xiǎn)
*/
String accessKeyId = System.getenv("NLP_AK_ENV");
String accessKeySecret = System.getenv("NLP_SK_ENV");
DefaultProfile defaultProfile = DefaultProfile.getProfile("cn-hangzhou",accessKeyId,accessKeySecret);
IAcsClient client = new DefaultAcsClient(defaultProfile);
Map<String, Object> obj = new HashMap<String, Object>();
obj.put("query","別把油煙機(jī)拆下來洗,一塊小肥皂,幾分鐘擦干凈,簡單又實(shí)用大家好,我是深圳小哥幫的小哥,專注分享家居生活妙招,歡迎關(guān)注!之前小哥跟大家聊過專業(yè)保潔人員清洗油煙機(jī)的方法,好多朋友留言說他們沒有專門的清潔工具,還是分享日常一些、不用拆洗的小竅門好一些,為此小哥一邊想方法一邊測試,終于可以分享幾個(gè)實(shí)用的妙招,快速去油垢,一起來學(xué)習(xí)吧!家用肥皂+衛(wèi)生紙?bào)@不驚喜!意不意外!你們以為我要說什么小蘇打,油煙機(jī)清洗劑之類嗎,不可鞥!說了是比較日常方法,肥皂衛(wèi)生間家家有,經(jīng)過小哥親測,用剩的肥皂碾壓成糊糊,用廢舊牙刷或者直接上手,涂抹在油煙機(jī)上,用溫水!幾分鐘后上面的油垢會(huì)自動(dòng)溶解,再用衛(wèi)生紙擦拭,完全不用拆油煙機(jī),擦完就干干凈凈!洗潔精+白醋很多主婦其實(shí)都用過洗潔精來清洗油煙機(jī),可能不得要領(lǐng),清潔程度不一,小哥個(gè)人建議用清潔精+白醋,用來擦洗油煙機(jī)的面板和油盒,清洗油盒時(shí),需要將油盒拿下來浸泡在洗潔精的溫水中,浸泡半個(gè)小時(shí)左后,用抹布擦拭,可以看到明顯效果!這兩個(gè)方法都是日常在家就能操作的,不需要買很多工具,需要清洗油煙機(jī)的朋友們可以試一下哦~");
obj.put("top_k",msgs);
obj.put("type","keyword_extraction");
RunPreTrainServiceRequest request = new RunPreTrainServiceRequest();
request.setServiceName("NLP-textrank");
request.setPredictContent(JSON.toJSONString(obj));
RunPreTrainServiceResponse response = client.getAcsResponse(request);
System.out.println(response.getPredictResult());
Python代碼示例
# 安裝依賴
pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-nlp-automl
# -*- coding: utf8 -*-
import json
import os
from aliyunsdkcore.client import AcsClient
from aliyunsdkcore.acs_exception.exceptions import ClientException
from aliyunsdkcore.acs_exception.exceptions import ServerException
from aliyunsdknlp_automl.request.v20191111 import RunPreTrainServiceRequest
/**
* 阿里云賬號(hào)AccessKey擁有所有API的訪問權(quán)限,風(fēng)險(xiǎn)很高。強(qiáng)烈建議您創(chuàng)建并使用RAM用戶進(jìn)行API訪問或日常運(yùn)維,請登錄RAM控制臺(tái)創(chuàng)建RAM用戶。
* 此處以把AccessKey和AccessKeySecret保存在環(huán)境變量為例說明。您也可以根據(jù)業(yè)務(wù)需要,保存到配置文件里。
* 強(qiáng)烈建議不要把AccessKey和AccessKeySecret保存到代碼里,會(huì)存在密鑰泄漏風(fēng)險(xiǎn)
*/
access_key_id = os.environ['NLP_AK_ENV']
access_key_secret = os.environ['NLP_SK_ENV']
# Initialize AcsClient instance
client = AcsClient(
access_key_id,
access_key_secret,
"cn-hangzhou"
);
content = {
"query": "別把油煙機(jī)拆下來洗,一塊小肥皂,幾分鐘擦干凈,簡單又實(shí)用大家好,我是深圳小哥幫的小哥,專注分享家居生活妙招,歡迎關(guān)注!之前小哥跟大家聊過專業(yè)保潔人員清洗油煙機(jī)的方法,好多朋友留言說他們沒有專門的清潔工具,還是分享日常一些、不用拆洗的小竅門好一些,為此小哥一邊想方法一邊測試,終于可以分享幾個(gè)實(shí)用的妙招,快速去油垢,一起來學(xué)習(xí)吧!家用肥皂+衛(wèi)生紙?bào)@不驚喜!意不意外!你們以為我要說什么小蘇打,油煙機(jī)清洗劑之類嗎,不可鞥!說了是比較日常方法,肥皂衛(wèi)生間家家有,經(jīng)過小哥親測,用剩的肥皂碾壓成糊糊,用廢舊牙刷或者直接上手,涂抹在油煙機(jī)上,用溫水!幾分鐘后上面的油垢會(huì)自動(dòng)溶解,再用衛(wèi)生紙擦拭,完全不用拆油煙機(jī),擦完就干干凈凈!洗潔精+白醋很多主婦其實(shí)都用過洗潔精來清洗油煙機(jī),可能不得要領(lǐng),清潔程度不一,小哥個(gè)人建議用清潔精+白醋,用來擦洗油煙機(jī)的面板和油盒,清洗油盒時(shí),需要將油盒拿下來浸泡在洗潔精的溫水中,浸泡半個(gè)小時(shí)左后,用抹布擦拭,可以看到明顯效果!這兩個(gè)方法都是日常在家就能操作的,不需要買很多工具,需要清洗油煙機(jī)的朋友們可以試一下哦~",
"top_k": 5,
"type": "keyword_extraction"
}
# Initialize a request and set parameters
request = RunPreTrainServiceRequest.RunPreTrainServiceRequest()
request.set_ServiceName('NLP-textrank')
request.set_PredictContent(json.dumps(content))
# Print response
response = client.do_action_with_exception(request)
resp_obj = json.loads(response)
predict_result = json.loads(resp_obj['PredictResult'])
print(predict_result)
PredictContent內(nèi)容示例
{
"query": "別把油煙機(jī)拆下來洗,一塊小肥皂,幾分鐘擦干凈,簡單又實(shí)用大家好,我是深圳小哥幫的小哥,專注分享家居生活妙招,歡迎關(guān)注!之前小哥跟大家聊過專業(yè)保潔人員清洗油煙機(jī)的方法,好多朋友留言說他們沒有專門的清潔工具,還是分享日常一些、不用拆洗的小竅門好一些,為此小哥一邊想方法一邊測試,終于可以分享幾個(gè)實(shí)用的妙招,快速去油垢,一起來學(xué)習(xí)吧!家用肥皂+衛(wèi)生紙?bào)@不驚喜!意不意外!你們以為我要說什么小蘇打,油煙機(jī)清洗劑之類嗎,不可鞥!說了是比較日常方法,肥皂衛(wèi)生間家家有,經(jīng)過小哥親測,用剩的肥皂碾壓成糊糊,用廢舊牙刷或者直接上手,涂抹在油煙機(jī)上,用溫水!幾分鐘后上面的油垢會(huì)自動(dòng)溶解,再用衛(wèi)生紙擦拭,完全不用拆油煙機(jī),擦完就干干凈凈!洗潔精+白醋很多主婦其實(shí)都用過洗潔精來清洗油煙機(jī),可能不得要領(lǐng),清潔程度不一,小哥個(gè)人建議用清潔精+白醋,用來擦洗油煙機(jī)的面板和油盒,清洗油盒時(shí),需要將油盒拿下來浸泡在洗潔精的溫水中,浸泡半個(gè)小時(shí)左后,用抹布擦拭,可以看到明顯效果!這兩個(gè)方法都是日常在家就能操作的,不需要買很多工具,需要清洗油煙機(jī)的朋友們可以試一下哦~",
"top_k": 5,
"type": "keyword_extraction"
}
PredictResult內(nèi)容示例
{
"keywords_or_summaries": [
"油煙機(jī)",
"小哥",
"清洗",
"肥皂",
"分享"
],
"scores": [
0.20365885857353325,
0.2007197193667164,
0.19899930843706187,
0.19868134965414105,
0.19794076396854748
]
}
入?yún)⒄f明
參數(shù) | 說明 |
query | 必填,待抽取的文檔內(nèi)容 |
top_k | 必填,要抽取的關(guān)鍵詞數(shù)量(type=keyword_extraction時(shí))或者句子的數(shù)量(type=text_summarization時(shí)) |
type | 選填,type=keyword_extraction時(shí)表示關(guān)鍵詞抽取,type=text_summarization時(shí)表示摘要抽取,默認(rèn)為keyword_extraction |
出參說明
參數(shù) | 說明 |
keywords_or_summaries | 抽取到的關(guān)鍵詞或者摘要句子列表,按照權(quán)重從高到低排序 |
scores | 對應(yīng)關(guān)鍵詞或者句子的權(quán)重值 |