實體是同類型單詞的合集,如:城市、日期、顏色等。語義通過實體進行理解,然后抽取并輸出機器可以理解的格式。例如用戶說「我喜歡綠色」,雖然都知道綠色是一種顏色,但如果不預先告訴機器,機器是不會知道的。為了讓機器能夠理解綠色,可以創建一個詞庫,把常見的顏色列舉,這樣機器再遇到這些詞,就能知道是一種顏色。
新建標準實體
在生活和業務當中,有很多不同的詞語代表著同一種意思,例如:北京、帝都、中國首都。這幾個詞語都是指同一個城市,那么就可以通過配置的方式將這些詞語指定到一個固定的實體下面。
創建一個火車座次的實體,在這個實體下面定義了兩種不同等級的座位。這個實體就可以直接在意圖里面進行使用了。
正則實體
正則表達式是一種可以用于模式匹配和替換的規范,一個正則表達式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)組成的文字模式,它用以描述在查找文字主體時待匹配的一個或多個字符串。正則表達式作為一個模板,將某個字符模式與所搜索的字符串進行匹配。
系統實體
為了讓用戶快速使用對話流的配置,系統預置了很多實體供用戶直接使用。
界面名稱 |
中文意思 |
實體解釋 |
例子 |
標準值(識別到的格式) |
@sys.number |
系統.數字 |
解析句子中的所有數字,包括中文數字和阿拉伯數字 |
一百二十五、100、零點三 |
123 |
@sys.phone-number |
系統.手機號碼 |
解析手機號碼 |
1*78***** |
1*78***** |
@sys.date |
系統.日期 |
解析所有的日期表達方式 |
明天、下周一、三月二十號、明年六月份、國慶節、2017-10-5 |
2017-11-11 |
@sys.time |
系統.時間 |
解析一天內的時間 |
上午九點、中午12點半、傍晚八點一刻 |
12:10:15 |
@sys.date-time |
系統.日期時間 |
解析日期加時間 |
明天中午十二點半、下周三早上八點一刻 |
2017-11-11 10:00:00 |
@sys.geo-city |
系統.城市 |
解析中國的所有城市 |
北京、杭州、上海 |
北京市 |
@sys.geo-province |
系統.省份 |
解析中國的所有省份 |
浙江、河北 |
浙江省 |
@sys.geo-country |
系統.國家 |
解析世界上的所有國家 |
中國、新加坡、毛里求斯 |
中國 |
@sys.age |
系統.年齡 |
解析年齡數字 |
15歲、30了、五十歲 |
30 |
@sys.address |
系統. 地址 |
解析多層級復雜地址 |
中國上海市靜安區巨鹿路882號 |
中國上海市靜安區巨鹿路882號 |
@sys.geo-district |
系統-區縣 |
解析標準的區縣 |
朝陽區 |
朝陽區? |
@sys.name |
系統-?名 |
魯迅 |
魯迅 |
|
@sys.duration |
系統.時間段 |
解析一個時間段、持續時間 |
一小時、15分鐘、一小時零五分等 |
|
@sys.timeset |
系統.重復時間 |
解析一個重復時間點的實體 |
每周一、每個工作日等 |
|
@sys.money |
系統-?額 |
解析金額 |
200元 |
|
@sys.temperature |
系統-溫度 |
解析溫度 |
20度、90攝?度、20.5華?度 |
|
@sys.numberrange |
系統-數字范圍 |
解析數字范圍 |
?到五,?于10 |
|
@sys.plate-number |
系統-?牌號 |
解析車牌號 |
浙A12345 |
浙A12345 |
@sys.surname |
系統-百家姓 |
解析姓氏 |
張 |
張 |
@sys.numberfraction |
系統-分數 |
解析分數 |
三分之?,1/3 |
1/3 |
@sys.percentage |
系統-百分數 |
解析百分數 |
百分之20,20% |
20% |
實體管理
重命名:重命名實體名稱(注意:實體名稱是定義實體的唯?信息,實體使?后不建議修改實體名稱) 實體配置:配置實體的具體信息,標準實體配置實體成員及對應的同義詞,正則實體配置正則表達式。 發布:將實體的配置發布到線上環境(發布對話機器?的時候,會同步發布實體;只有單獨修改實體配置的時候可使?此發布功能) 導出:?持單個實體導出,批量導出和全量導出。導?實體基本信息(實體名和類型),實體配置?;拘畔⒉煌扑]在導出?件中編輯修改,實體配置可以在導??件中增加,導?后實體配置會?動進?合并。 導?:?持導?實體。導?意圖可以新增實體成員、新增同義詞、正則表達式。 搜索:可以使?實體名稱檢索機器?內的實體